La furieuse bataille pour renverser l’entreprise la plus précieuse du monde

La concurrence accrue était évidente mardi, lorsqu'Amazon a annoncé la disponibilité de services informatiques basés sur ses nouvelles puces Trainium 2 AI et des témoignages d'utilisateurs potentiels, dont Apple. La société a également dévoilé des ordinateurs contenant 16 ou 64 puces, dotés de connexions réseau ultrarapides qui accélèrent particulièrement les performances d'inférence.

Amazon est même en train de construire une sorte d'usine géante d'IA pour la startup Anthropic, dans laquelle il a investi, a déclaré Matt Garman, directeur général d'Amazon Web Services. Ce « cluster » informatique contiendra des centaines de milliers de nouvelles puces Trainium et sera cinq fois plus puissant que tous ceux qu'Anthropic a jamais utilisés, a déclaré Tom Brown, fondateur et directeur informatique de la startup, qui exploite le chatbot Claude. et est basé à San Francisco.

La nouvelle puce d'intelligence artificielle MI300 d'AMD devrait générer plus de 5 milliards de dollars de ventes au cours de sa première année de lancement.Crédit: New York Times

« Cela signifie que les clients bénéficieront de plus d'intelligence à un prix inférieur et à des vitesses plus rapides », a déclaré Brown.

Au total, les dépenses des opérateurs de centres de données en ordinateurs sans puces Nvidia, qui fournissent la puissance de calcul nécessaire aux tâches d'IA, devraient augmenter de 49 % cette année pour atteindre 126 milliards de dollars, selon Omdia, une société d'études de marché.

Pour autant, la concurrence accrue ne signifie pas que Nvidia risque de perdre son avance. Un porte-parole de la société a souligné les commentaires de Jensen Huang, directeur général de Nvidia, qui a déclaré que sa société disposait d'avantages majeurs en matière de logiciels d'IA et de capacité d'inférence. Huang a ajouté que la demande est énorme pour les nouvelles puces Blackwell AI de l'entreprise, qui, selon lui, effectuent beaucoup plus de calculs par watt d'énergie utilisé, malgré une augmentation de la puissance dont elles ont besoin pour fonctionner.

« Notre coût total de possession est si bon que même lorsque les puces des concurrents sont gratuites, elles ne sont pas assez bon marché », a déclaré Huang dans un discours à l'Université de Stanford cette année.

L'évolution du marché des puces d'IA a été en partie propulsée par des startups bien financées telles que SambaNova Systems, Groq et Cerebras Systems, qui ont récemment revendiqué de grands avantages en termes de vitesse d'inférence, avec des prix et une consommation d'énergie inférieurs. Les puces actuelles de Nvidia peuvent coûter jusqu'à 15 000 dollars pièce, et ses puces Blackwell devraient coûter des dizaines de milliers de dollars pièce.

Cela a poussé certains clients vers des alternatives. Dan Stanzione, directeur exécutif du Texas Advanced Computing Centre, un centre de recherche, a déclaré que l'organisation prévoyait d'acheter un supercalculateur basé à Blackwell l'année prochaine, mais qu'elle utiliserait très probablement également des puces de SambaNova pour des tâches d'inférence en raison de leur faible consommation d'énergie et de leur prix.

« Ces produits sont tout simplement trop chers », a-t-il déclaré à propos des puces Nvidia.

AMD a déclaré qu'il prévoyait de cibler les puces Blackwell de Nvidia avec ses propres nouvelles puces IA qui arriveront l'année prochaine. Dans les laboratoires de l'entreprise à Austin, où l'entreprise teste de manière exhaustive les puces IA, les dirigeants ont déclaré que l'inférence des performances était un argument de vente majeur. L'un de ses clients est Meta, propriétaire de Facebook et d'Instagram, qui affirme avoir formé un nouveau modèle d'IA, appelé Llama 3.1 405B, en utilisant des puces Nvidia, mais qu'il utilise des puces AMD MI300 pour fournir des réponses aux utilisateurs.

Jensen Huang a fait de Nvidia l'entreprise la plus valorisée au monde.

Jensen Huang a fait de Nvidia l'entreprise la plus valorisée au monde.Crédit: Bloomberg

Amazon, Google, Microsoft et Meta conçoivent également leurs propres puces d'IA pour accélérer des tâches informatiques spécifiques et réduire les coûts, tout en continuant à construire de grands clusters de machines alimentées par les puces de Nvidia. Ce mois-ci, Google prévoit de commencer à vendre des services basés sur une sixième génération de puces développées en interne, appelée Trillium, qui est près de cinq fois plus rapide que son prédécesseur.

Amazon, parfois perçu comme un retardataire en matière d’IA, semble particulièrement déterminé à rattraper son retard. La société a alloué cette année 75 milliards de dollars aux puces IA et à d’autres matériels informatiques, entre autres dépenses en capital.

Dans les bureaux de l'entreprise à Austin, gérés par Annapurna Labs, une startup rachetée en 2015, les ingénieurs développaient auparavant des puces réseau et des microprocesseurs à usage général pour Amazon Web Services. Ses premières puces d’IA, y compris la première version de Trainium, n’ont pas gagné beaucoup de terrain sur le marché.

Amazon est beaucoup plus optimiste quant aux nouvelles puces Trainium 2, qui sont quatre fois plus rapides que les puces précédentes. Mardi, la société a également annoncé son intention de développer une autre puce, Trainium 3, qui devrait être encore plus puissante.

Eiso Kant, directeur technologique de Poolside, une startup d'IA à Paris, a estimé que Trainium 2 apporterait une amélioration de 40 % des performances informatiques par dollar par rapport au matériel basé sur Nvidia.

Amazon prévoit également de proposer des services basés sur Trainium dans les centres de données du monde entier, a ajouté Kant, ce qui facilite les tâches d'inférence.

« La réalité est que, dans mon entreprise, je me fiche de ce qu'il y a en dessous du silicium », a-t-il déclaré. « Ce qui m'importe, c'est d'obtenir le meilleur rapport qualité-prix et de pouvoir le proposer à l'utilisateur final. »

Cet article a été initialement publié dans Le New York Times.