Pequim – Na semana passada, a indústria global de inteligência artificial (IA) foi fixada em uma coisa e apenas uma coisa: o surgimento de, até agora, uma start-up chinesa pouco conhecida chamada Deepseek.
Este novato de capital fechado, fundado apenas em 2023, parece ter surgido do nada e fez o impensável com seus modelos de idiomas grandes de código aberto.
Quando abandonou seu modelo de uso geral V3 no dia seguinte Natal 2024a indústria da IA ficou pasgada de que a Deepseek poderia rivalizar com o desempenho de chatbots construídos por gigantes da IA como Openai e Google, que isso é pesquisadores disse que sim com muito menos recursos de computação e dinheiro.
Na semana passada, seu modelo de raciocínio, o R1, surpreendeu o mundo ao derrotar o modelo O1 do Openai em certos parâmetros de referência, como tarefas avançadas de matemática e programação.
Os nerds tecnológicos em todos os lugares que o fizeram à prova ficaram impressionados, desencadeando uma enorme venda de ações da fabricante de chips do US NVIDIA que limparam quase US $ 600 bilhões (US $ 812 bilhões) do seu valor de mercado, o maior perda de um dia na história do mercado de ações dos EUA.
Uma narrativa de triunfo sobre a adversidade apreendeu rapidamente essa história de sucesso instantânea, um momento de pisar no nariz para os chineses que são forçados a inovar diante das sanções tecnológicas dos EUA.
É uma narrativa compartilhada pela gigante da tecnologia chinesa Huawei, que abalou o governo Biden quando revelou seu chip avançado caseiro em seu smartphone Mate 60 em 2023.
Deepseek diz que usou apenas cerca de 2.000 chips Nvidia H800 para treinar seu chatbot, enquanto outras empresas de IA líder precisam de quase 10 vezes mais do que isso.
Em uma entrevista em 2023, o fundador de baixo perfil da Deepseek, Liang Wenfeng, reconheceu GPUs estocando, ou chips, já em 2015, até que ele acumulou cerca de 10.000 até 2021 antes do governo Biden limitar as exportações avançadas de chip para a China.
https://www.youtube.com/watch?v=q67feeo9ptq
Ele foi motivado por uma “curiosidade sobre os limites das capacidades da IA” então, então, disse o empresário de 40 anos de uma pequena cidade em Guangdong, que fez sua fortuna depois de co-fugir de um fundo de hedge quantitativo, High-Flyer, em 2016.
O número de chips em Deepseek’s Trove já foi questionado.
Em Davos, na semana passada, o fundador da IA American AI Start-up, Alexandr Wang, disse que era seu entendimento de que a Deepseek tem 50.000 de Nvidia é mais poderoso H100 chips.
“Eles têm mais batatas fritas do que as pessoas esperam, mas daqui para frente, elas serão limitadas pelos controles de chip e pelos controles de exportação que temos em vigor”, disse Wang, 28 anos, filho americano de pais imigrantes chineses que são físicos.
Deepseek não comentou a afirmação de Wang. Mas em uma entrevista anterior, o Sr. Liang, de Deepseek, foi sincero sobre o maior gargalo com o qual ele é confrontado.
“O problema que enfrentamos nunca foi dinheiro, mas a proibição de chips sofisticados”, disse Liang, que estudou engenharia eletrônica e de informação na Universidade de Zhejiang, uma das principais escolas da China.
O Rapid Rise de Deepseek, com sede em Hangzhou, já chamou a atenção da liderança da China. Na semana passada, Liang estava entre um grupo seleto de representantes em diferentes setores convidados a conhecer o primeiro -ministro Li Qiang, que procurou sua opinião sobre os desenvolvimentos em cada um de seus domínios.
A China identificou o desenvolvimento da IA como uma das principais prioridades que serão críticas para o seu futuro como um poder econômico e militar, bem como uma solução para suas complexas necessidades sociais.
As estimativas apontam para um impressionante 10 trilhões de yuans (US $ 1,9 trilhão) que podem ser investidos na indústria de IA da China nos próximos seis anos.
Esse Deepseek afirma confiar apenas em talentos locais – os melhores cérebros das principais universidades como Tsinghua e Pequim University – apenas serve para avançar na narrativa nacionalista que já começou a se apossar nas mídias sociais chinesas.
Existe toda a expectativa de que o governo chinês jogue seu peso por trás dos esforços desta inicial start-up e a acelere se ainda não o fizer.
O Sr. Feng Ji, o criador do popular jogo Black Myth: Wukong, chamou os modelos de IA de Deepseek “de” uma conquista científica e tecnológica do significado nacional “.
E a emoção já dirigiu chineses curiosos – e outros – para baixar e testar Deepseek, levando -o ao topo de Apple App Store’s Baixar gráficos nos EUA, China e em outros lugares.
Deepseek disse em 27 de janeiro que teve que limitar os registros depois de ficar sob um ataque cibernético.
Mas quão real é o hype? E os EUA estão em risco de serem ultrapassados na corrida de IA?
As limitações de Deepseek são exatamente o que Liang diz ser sua maior dor de cabeça – ela está cercada pela quantidade de energia de computação disponível, o que não é um problema que abre a IA, Google ou Meta Face. Os EUA ainda lidera o mundo no número de data centers – Mais de 5.000 deles, o que é 10 vezes mais do que o que a China tem.
E a dor dos controles de exportação dos EUA, que atingiu em 2022 e 2023, pode ainda não ser totalmente sentida.
O presidente dos EUA, Donald Trump, já descreveu o sucesso da Deepseek com seu chatbot como “um alerta”, e haverá pressão renovada para ele fortalecer os controles de exportação.
Mas para os jogadores da Deepseek e outros chineses de IA, esse momento é um marco significativo na história que se desenrola da ascensão da inteligência artificial. E todos os estarão assistindo de perto a partir de agora.
Juntar Canal de telegrama da ST E receba as últimas notícias de última hora.