Um dos maiores laboratórios de inteligência artificial da China, o DeepSeek, lançou uma versão aberta do modelo de raciocínio DeepSeek-R1, que promete ter o mesmo desempenho que o o1 da OpenAI em determinados benchmarks de AI. O R1 está disponível na plataforma de desenvolvimento de IA Hugging Face sob uma licença MIT, o que significa que pode ser usado comercialmente sem restrições. De acordo com o DeepSeek, o R1 supera o o1 nos benchmarks AIME, MATH-500 e SWE-bench Verified. O AIME utiliza outros modelos para avaliar o desempenho de um modelo, enquanto o MATH-500 é uma coleção de problemas de palavras. Enquanto isso, o SWE-bench Verified foca em tarefas de programação.
Sendo um modelo de raciocínio, o R1 efetivamente verifica suas próprias informações, o que o ajuda a evitar algumas das armadilhas que normalmente atrapalham outros modelos. Modelos de raciocínio levam um pouco mais de tempo — geralmente segundos a minutos a mais — para chegar às soluções em comparação com modelos não de raciocínio. A vantagem é que tendem a ser mais confiáveis em áreas como física, ciência e matemática. O R1 contém 671 bilhões de parâmetros, revelou o DeepSeek em um relatório técnico. Parâmetros correspondem aproximadamente às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros geralmente têm melhor desempenho do que aqueles com menos parâmetros. De fato, 671 bilhões de parâmetros é massivo, mas o DeepSeek também lançou versões “destiladas” do R1 com tamanhos que variam de 1,5 bilhão a 70 bilhões de parâmetros. O menor pode rodar em um laptop. Quanto ao R1 completo, ele requer hardware mais robusto, mas está disponível através da API do DeepSeek a preços 90%-95% mais baratos do que o o1 da OpenAI.
Há um ponto negativo no R1. Por ser um modelo chinês, está sujeito à avaliação do regulador de internet da China para garantir que suas respostas “incorporem valores socialistas essenciais”. Por exemplo, o R1 não responderá perguntas sobre a Praça da Paz Celestial ou a autonomia de Taiwan.

Muitos sistemas de inteligência artificial chineses, incluindo outros modelos de raciocínio, se recusam a responder a tópicos que possam irritar os reguladores no país, como especulações sobre o regime de Xi Jinping. O R1 chega dias depois que a administração Biden propôs regras mais rígidas de exportação e restrições sobre tecnologias de IA para empreendimentos chineses. Empresas na China já estavam impedidas de comprar chips de IA avançados, mas se as novas regras entrarem em vigor conforme escritas, as empresas enfrentarão limites mais rígidos tanto na tecnologia de semicondutores quanto nos modelos necessários para iniciar sistemas de IA sofisticados.
Até agora, pelo menos três laboratórios chineses — DeepSeek, Alibaba e Kimi, que pertence ao unicórnio chinês Moonshot AI — produziram modelos que afirmam rivalizar com o o1. Destaque para o DeepSeek, que foi o primeiro — anunciou uma prévia do R1 no final de novembro. Em uma publicação, Dean Ball, pesquisador de IA da Universidade George Mason, disse que a tendência sugere que os laboratórios chineses de IA continuarão sendo “seguidores rápidos”. “O impressionante desempenho dos modelos destilados do DeepSeek […] significa que raciocinadores muito capazes continuarão a se proliferar amplamente e poderão ser executados em hardware local”, escreveu Ball, “longe dos olhos de qualquer regime de controle centralizado”.
Esta reportagem foi originalmente publicada em 20 de janeiro e atualizada em 27 de janeiro com mais informações.
Leave a Reply