Le tremblement de terre en profondeur n'est pas tout ce qu'il semble

Cependant, notez que Nvidia a salué Deepseek comme une aubaine pour l'industrie, car elle devrait accélérer l'adoption mondiale de l'IA, et donc entraîner une augmentation de la demande des autres GPU de Nvidia.

Les fissures commencent à apparaître dans l'histoire de Deepseek miraculeuse. L'entreprise est le laboratoire de recherche et le projet pour animaux de compagnie de Liang Wenfeng, fondateur reclus du Haid Fund High-Flyer et New Hero of the Communist Party.

Le 20 janvier, Deepseek a publié l'open source R1, affirmant qu'il avait formé le modèle en moins de deux mois avec des puces de qualité inférieure à un coût trivial de 5,6 millions de dollars. «Nous avons fini de suivre. Il est temps de diriger », a-t-il déclaré dans une rare sortie publique découverte par la China Academy.

Il a déclaré que l'embargo américain sur les puces haut de gamme avait forcé son équipe à s'appuyer sur «l'inférence», une forme de formation d'IA qui dépend de la reconnaissance des modèles dans les données. «Nous n'avons jamais eu l'intention d'être un perturbateur; C'est arrivé par accident », a-t-il déclaré. Mirabile dictu.

Mais qu'est-ce qui s'est vraiment passé dans la recette secrète au siège de Deepseek à Hangzhou? Alexandr Wang, chef de l'échelle de l'IA à San Francisco, a déclaré que les potins de Chine sont que le laboratoire a en fait utilisé 50 000 des meilleurs GPU H100, soit stocké à l'avance ou obtenu sur le marché noir mondial depuis que les États-Unis ont imposé son blocage de puces.

« Ils ne peuvent pas en parler, évidemment, car c'est contre les contrôles des exportations que les États-Unis ont mis en place », a-t-il déclaré à CNBC. Liang Wenfeng lui-même de Deepseek a déclaré la semaine dernière dans un symposium la semaine dernière que la pénurie de puces avancées était un «goulot d'étranglement» retenant son laboratoire.

L'inférence est que Deepseek agit en réalité en tant qu'agent du régime, s'appuyant sur les ressources complètes et les réserves stratégiques de GPU de l'État chinois, et se prêtant également à une campagne subtile pour essayer de saper le soutien à l'embargo américain à Washington.

Dans l'affirmative, la Chine n'a en fait pas élaboré un modèle aussi ultra-coche qui fracasse la concurrence, ou qui ouvre soudainement la voie à l'utilisation de masse de l'IA.

Les réclamations de Deepseek sur la crédulité des coûts. La méta de Mark Zuckerberg dépense plus de 60 milliards de dollars cette année sur l'IA. Son Llama 4 devrait coûter 600 millions de dollars américains et nécessitera 160 000 GPU avancés pour former le modèle. L'IA ouverte brûle 5 milliards de dollars par an sur son architecture Chatgpt à source proche. Sam Altman d'Openai a sollicité 5 billions de dollars. Oui, milliards.

Peu contestent sur les capacités de Deepseek, tant que vous ne vous posez pas de pose sur le Tibet ou les Ouïghours, mais à cet égard, il ressemble beaucoup à Wikipedia: inutilisable pour la politique.

Le fondateur de Deepseek, Liang Wenfeng (à droite), illustré à un symposium présidé par le Premier ministre chinois Li Qiang plus tôt ce mois-ci, dit que « devrait être abordable et accessible à tous ».

Marc Andreessen, Eminence Grise de l'oligarchie technologique de Trump, a salué la société, appelant le nouveau modèle R1 le moment Sputnik pour la Silicon Valley. « L'une des percées les plus incroyables et les plus impressionnantes que j'ai jamais vues », a-t-il déclaré.

Deepseek correspond aux rivaux américains sur les mathématiques, le codage et le raisonnement, ce qui est remarquable en soi, car la Chine n'a pas l'écosystème complet de l'IA et se classe 17e dans l'indice d'IA de l'économie des capitaux.

Les États-Unis sont d'abord, suivis de Singapour, du Royaume-Uni et de la Suisse. Les grands États de l'Europe sont à la traîne – Allemagne en 12e place, en France 20e et en Italie 25e – s'ils peuvent garder quelque chose après la loi suicidaire de l'IA de l'UE.

Nathan Benaich, fondateur de Air Street Capital, a déclaré à Sift que les «vrais perdants» de la Saga Deepseek sont des entreprises européennes qui construisent des modèles d'apprentissage des langues. Les dominos tomberont dur et rapidement. «Ces entreprises ont déjà eu du mal à se différencier sur le prix ou les performances, donc Deepseek R1 présente une tempête parfaite pour elles.»

Les agences de renseignement américaines ont probablement une bonne idée de savoir si Deepseek dit toute la vérité sur son utilisation des GPU NVIDIA, et cela informera à son tour si Washington opte pour des sanctions plus difficiles. Mais si Trump emprunte cette voie, il divisera davantage le monde en camps technologiques opposés. Le Sud mondial gravitera de plus en plus vers la Chine.

La conclusion appropriée à tirer à ce stade est que Deepseek a véritablement ébranlé le monde de la technologie à ses fondements et a peut-être ouvert un chemin vers une IA de masse «démocratise» qui ne engloutit pas l'électricité mondiale, même si la société jette du sable dans notre yeux sur le véritable coût et les méthodes.

Cela seul est un événement géopolitique sismique, comme l'a averti Satya Nadella de Microsoft à Davos. « Nous devons retirer les développements de la Chine très, très au sérieux », a-t-il déclaré.

Telegraph, Londres