O que é DeepSeek, empresa de AI da China?
Startup chinesa expôs possibilidade de desenvolver modelos de AI com menos recursos do que gigantes dos EUA, derrubando capitalização de mercado de companhias norte-americanas
Lançado no dia 20 de janeiro de 2025, o DeepSeek-R1 é um modelo de AI (inteligência artificial) da startup chinesa DeepSeek, que ganhou notoriedade, principalmente, nesta segunda-feira (27.jan.2025). Tornou-se o aplicativo mais baixado na Apple Store, desbancando concorrentes como o ChatGPT, da OpenAI.
"Fui projetado para ajudar em uma variedade de tarefas, como responder perguntas, gerar textos, traduzir idiomas, ajudar com criatividade e muito mais. Sou treinado com base em grandes volumes de dados e uso técnicas avançadas de processamento de linguagem natural (NLP) para entender e gerar textos de forma coerente e contextualizada", respondeu o DeepSeek ao Correio Sabiá na noite desta segunda-feira (27.jan).
Também consultamos o ChatGPT sobre o seu concorrente. Eis o que nos disse a AI da OpenAI (*note que a resposta se refere a um modelo de linguagem anterior da DeepSeek, mas funciona para fins de contexto geral sobre a startup):
"Trata-se de uma startup chinesa de inteligência artificial que recentemente ganhou destaque com o lançamento do DeepSeek-V3, um modelo de linguagem avançado com 671 bilhões de parâmetros. Este modelo foi treinado com 14,8 trilhões de tokens de alta qualidade, posicionando-se entre os mais avançados disponíveis atualmente."
"O DeepSeek-V3 é de código aberto e gratuito para uso comercial, permitindo que desenvolvedores e empresas o integrem em suas aplicações. Ele pode ser experimentado diretamente através de uma demonstração online sem necessidade de registro ou baixado para execução local via repositório no GitHub."
"Recentemente, o DeepSeek-V3 superou o ChatGPT como o aplicativo gratuito mais popular em vários países, incluindo o Reino Unido 🇬🇧, os EUA 🇺🇸 e a China 🇨🇳. No entanto, o aplicativo enfrentou desafios, como ataques cibernéticos que impediram novos registros de usuários."
"A ascensão do DeepSeek tem gerado debates sobre o equilíbrio de poder no campo da inteligência artificial, especialmente considerando as restrições de acesso a semicondutores avançados impostas pelos EUA à China."
Nvidia perde US$ 598 bilhões em valor de mercado em 1 dia
A preocupação de investidores com a ascensão do DeepSeek fez a Nvidia (líder mundial em computação visual e inteligência artificial) perder quase US$ 600 bilhões num único dia (exatamente US$ 598 bilhões) em capitalização de mercado, no pregão desta segunda-feira (27.jan.2025). A queda foi de 17%, a maior desde março de 2020.
💭 Contexto
Numa tentativa de atrasar o avanço da China 🇨🇳 com inteligência artificial, os Estados Unidos 🇺🇸 proibiram a exportação de tecnologias avançadas de semicondutores para o país asiático e limitaram as vendas de chips de AI da Nvidia.
No entanto, o progresso da DeepSeek sugere que engenheiros chineses conseguiram driblar as dificuldades impostas pelos Estados Unidos e encontraram soluções mais eficientes, mesmo com recursos limitados.
O avanço da DeepSeek ocorre num momento em que:
- O governo dos EUA, já sob o presidente Donald Trump, anunciou o Stargate, plano de US$ 100 bilhões (podendo chegara a US$ 500 bilhões em 4 anos) para construir centros de dados e projetos de AI, numa joint venture (associação de empresas) entre OpenAI, SoftBank e Oracle.
- A Meta anunciou na sexta-feira (24.jan) o plano de aumentar seus investimentos em projetos de AI para até US$ 65 bilhões neste ano.
- Os CEOs das principais empresas norte-americanas de tecnologia, como Elon Musk (Tesla, SpaceX e outras), Mark Zuckerberg (Meta), Jeff Bezos (Amazon) e Sundar Pichai (Google) participaram com destaque da cerimônia de posse do presidente Trump, sugerindo o papel importante que essas empresas tendem a ocupar no novo governo.
Como a DeepSeek conseguiu ser tão competitiva?
Empresas como Microsoft, Google e Nvidia investem bilhões de dólares em inteligência artificial. Elas têm uma enorme vantagem de mercado porque desenvolvem modelos (como o ChatGPT, da OpenAI) que demandam equipamentos caríssimos e anos de pesquisa.
O mercado ficou surpreso quando a DeepSeek lançou o modelo de AI chamado DeepSeek-R1, porque o modelo é tão avançado quanto os das grandes empresas norte-americanas, mas desenvolvido com muito menos recursos financeiros e tecnológicos.
Para efeito de comparação, o modelo DeepSeek-V3, modelo 1 mês mais antigo do que o DeepSeek-R1, foi treinado por cerca de US$ 6 milhões, enquanto o Llama 3.1, da Meta, custou mais de US$ 60 milhões.
A DeepSeek usou algumas estratégias para competir, mesmo com menos recursos:
Eficiência no uso de chips (GPUs):
- Para treinar modelos de AI, geralmente são usadas milhares de GPUs (processadores especiais usados para tarefas complexas). As empresas dos EUA usam cerca de 16 mil, que são ainda mais potentes e caros do que os usados pela empresa chinesa.
- Já a DeepSeek usou apenas 2.048 GPUs Nvidia H800, que são mais acessíveis e não estão sujeitas a sanções tão rígidas impostas pelos EUA à China.
Menor dependência de dados:
- Normalmente, modelos de AI avançados são treinados com gigantescas quantidades de dados, o que custa caro.
- A DeepSeek usou menos dados, mas de altíssima qualidade, o que permitiu resultados impressionantes com menos esforço.
Código aberto (Open Source):
- A DeepSeek disponibilizou seu modelo de AI gratuitamente para uso comercial.
Custo mais baixo de operação:
- Por ser mais eficiente no uso de energia e equipamentos, o modelo da DeepSeek custa muito menos para ser mantido, tornando-o mais acessível. Quase 18x mais barato que o GPT-4o.
Nvidia: "Comprá nuestras GPUs de 40 lucas verdes"
— Alan Daitch (@AlanDaitch) January 27, 2025
DeepSeek: "Amigo, con la placa que tenés para el Counter ya podés entrenar IA"
Cómo una empresa china acaba de hackear las reglas del juego y está tumbando la bolsa estadounidense 🧵👇
*Este conteúdo foi produzido por um humano, com auxílio de AI. Para saber mais sobre nossas Políticas de Uso de AI, acesse este link.
Apoie nossos voos
Fazemos um trabalho jornalístico diário e incansável desde 2018, porque é isso que amamos e não existe nada melhor do que fazer o que se ama. Somos movidos a combater a desinformação e divulgar conhecimento científico.
Fortalecemos a democracia e aumentamos a conscientização sobre a preservação ambiental. Acreditamos que uma sociedade bem-informada toma decisões melhores, baseadas em fatos, dados e evidências. Empoderamos a audiência pela informação de qualidade.
Por ser de alta qualidade, nossa operação tem um custo. Não recebemos grana de empresas, por isso precisamos de você para continuar fazendo o que mais gostamos: cumprir nossa missão de empoderar a sociedade civil e te bem-informado. Nosso jornalismo é independente porque ele depende de você.
Apoie o Correio Sabiá. Cancele quando quiser.