Os mercados financeiros e especialmente as grandes empresas de tecnologia estão em alerta após o lançamento, por parte da startup DeepSeek, da China, de um chatbot de Inteligência Artificial (IA) generativa comparável aos modelos da OpenAI – ou até superior em algumas performances. Desde o lançamento, os modelos R1 e V3 conquistaram uma onda de consumidores que levaram a DeepSeek ao topo da Apple Store, além de alcançarem o topo em rankings de chatbots IA. Mas, afinal, o que é a DeepSeek?
O que é a DeepSeek?
A DeepSeek é uma empresa chinesa de Inteligência Artificial que desenvolve modelos de linguagem de código aberto (LLM). Ela foi fundada em 2023 em Hangzhou, Zhejiang, e é de totalmente financiada pelo fundo de hedge chinês High-Flyer. O cofundador do fundo, Liang Wenfeng, atua como CEO.
O que faz a DeepSeek?
O DeepSeek realiza tarefas de raciocínio e aprendizagem sem ajuste fino supervisionado, assim como o ChatGPT, da americana OpenAI.
Quanto custa a DeepSeek?
O DeepSeek tornou seu chatbot de Inteligência Artificial generativa de código aberto, o que significa que ele está disponível gratuitamente para uso, modificação e visualização; isso inclui permissão para ar e utilizar o código-fonte e documentos de design para fins de construção.
Quais os diferenciais da DeepSeek?
As ferramentas da DeepSeek foram, de acordo com a empresa, desenvolvidas com um custo muito mais baixo e utilizando menos recursos. Treinar o R1 custou US$ 5,6 milhões, valor que exclui gastos com pesquisa e desenvolvimento, mas que é significativamente menor em comparação com a faixa de US$ 100 milhões a US$ 1 bilhão citada no ano ado pelo CEO da rival americana Anthropic para criar um modelo parecido. É muito menos, também do que bilhões de dólares que a OpenAI e a Oracle se comprometeram a investir na iniciativa Stargate para impulsionar o setor de IA nos EUA.
A DeepSeek também disse em um relatório técnico que usou um cluster de mais de 2 mil chips Nvidia para treinar seu modelo V3, em comparação com dezenas de milhares de chips que normalmente são usados para treinar modelos de tamanho semelhante. Os chips também são menos avançados do que os de concorrentes, frente ao aumento de sanções dos EUA sobre exportações de semicondutores para a China.
Analistas consultados pelo Wall Street Journal apontam que essa ascensão rápida levanta questões sobre os gastos elevados de big techs americanas para financiar seus modelos de IA e coloca em xeque a valorização elevada de ações de fabricantes de chips.
Qual o impacto da DeekSeek?
O modelo de IA foi desenvolvido pelo DeepSeek em meio a sanções dos EUA contra a China em relação aos chips da Nvidia, que visavam restringir a capacidade do país de desenvolver sistemas avançados de IA. Até 27 de janeiro, o primeiro aplicativo gratuito de chatbot da DeepSeek havia superado o ChatGPT como o app gratuito mais baixado na App Store do iOS nos Estados Unidos.
O sucesso do DeepSeek contra concorrentes maiores e mais estabelecidos foi descrito como “revolucionando a IA” e constituindo “o primeiro golpe naquilo que está se tornando uma corrida espacial global de IA”.
Nesta segunda, 27, diante do excesso de os, a DeepSeek anunciou que restringiu a possibilidade de novos cadastros em sua plataforma. De acordo com o site oficial que divulga o status de funcionamento do modelo de IA, apenas números de telefone da China podem se registrar para utilizar o serviço. O comunicado da DeepSeek foi acompanhado de um alerta sobre uma “degradação” no desempenho da plataforma.
Repercussões
Morgan Brown, desenvolvedor de Inteligência Artificial (IA) da Dropbox
Morgan Brown afirmou que as inovações da chinesa DeepSeek “deixaram o mundo da IA em choque”. Em uma publicação no X, ele destacou a “gigantesca” redução de custos alcançada pela concorrente da OpenAI para treinar seus modelos. “OpenAI e outras gastam mais de US$ 100 milhões apenas em computação. Chega a DeepSeek e diz: ‘e se fizéssemos isso por US$ 5 milhões" crossorigin="anonymous">