DeepSeek, a empresa de inteligência artificial, surpreendeu o mundo tech com seu novo modelo de raciocínio, o R1, que é de código aberto. A novidade causou um movimento de venda das ações da Nvidia e fez com que seu aplicativo para consumidores disparasse nas lojas de apps.
No mês passado, a DeepSeek treinou um modelo utilizando cerca de 2.000 GPUs H800 da Nvidia em um data center em apenas dois meses, com um custo de cerca de US$ 5,5 milhões. Na semana passada, publicaram um paper mostrando que o desempenho de seu último modelo estava à altura dos mais avançados modelos de raciocínio do mundo, os quais são treinados em data centers que gastam bilhões em chips de IA caros e rápidos.
A reação da indústria tech ao modelo de alto desempenho e baixo custo da DeepSeek foi intensa. Até Pat Gelsinger, ex-CEO da Intel e atual presidente de sua própria startup, Gloo, plataforma de mensagens para igrejas, comemorou a novidade.

Segundo Gelsinger, o DeepSeek traz três lições importantes para a indústria tech: custos mais baixos significam uma adoção mais ampla; a criatividade floresce sob restrições; e “o código aberto vence”. Ele afirmou que o R1 é tão impressionante que sua empresa, Gloo, decidiu não adotar e pagar pelo OpenAI. Em vez disso, estão construindo um serviço de IA chamado Kallm, que oferecerá um chatbot e outros serviços.
Diferentemente de outros que duvidam dos números ou acham que o DeepSeek contornou as restrições de exportação de chips de IA dos EUA para a China, Gelsinger está otimista. Para ele, o avanço da IA será impulsionado pela criatividade e não simplesmente por mais poder de hardware e recursos computacionais.
Em resumo, o DeepSeek está revolucionando o mercado da inteligência artificial com seu modelo de raciocínio de código aberto. Seu impacto já está sendo sentido e promete trazer uma nova era de IA acessível e de qualidade para diversos setores.
Leave a Reply