🎯 Réponse Rapide et Points Clés :
En mars 2026, ARM a lancé l’AGI CPU, son tout premier processeur fabriqué en propre en plus de 35 ans d’existence. Conçu pour les centres de données IA, il embarque 136 cœurs Neoverse V3, une bande passante mémoire de 845 Go/s et affiche des performances deux fois supérieures aux CPU x86 par rack.
Les points essentiels :
– 136 cœurs Neoverse V3 cadencés à 3,2 GHz (boost à 3,7 GHz), gravés en 3 nm par TSMC
– Bande passante mémoire agrégée de 845 Go/s, soit 6 Go/s par cœur, avec une latence inférieure à 100 ns
– ARM vise 15 milliards de dollars de revenus additionnels d’ici 2031 grâce à ce pivot stratégique
ARM, 35 ans de licences : pourquoi ce virage en 2026 ?
ARM n’a jamais fabriqué de puces. Depuis sa fondation, la société britannique a bâti son empire autrement : en concevant des architectures de processeurs, puis en les licenciant à Apple, Qualcomm, Samsung, Amazon ou Google.
Ce modèle a fonctionné à merveille. Aujourd’hui, plus de 99 % des smartphones tournent sur une architecture ARM. Mais le marché a changé.
L’essor de l’IA générative et des agents autonomes crée une demande explosive en puissance de calcul dans les centres de données. Et là, ARM était absent du terrain. Pas de puce propre, pas de revenus directs sur ce segment en pleine explosion.
En février 2025, le Financial Times révélait qu’ARM préparait ses propres processeurs. En mars 2026, lors de la conférence ARM Everywhere 2026, l’annonce est officielle : l’AGI CPU est là.
L’AGI CPU : que signifie ce nom ?
Le nom « AGI » ne fait pas référence à l’Intelligence Artificielle Générale (Artificial General Intelligence) au sens philosophique du terme. ARM utilise cet acronyme pour positionner sa puce comme le processeur de référence de l’ère agentique — celle des systèmes IA capables d’exécuter des tâches complexes en autonomie.
C’est un choix de communication assumé, et un signal fort envoyé au marché.
Les spécifications techniques de l’ARM AGI CPU
Voici ce que l’on sait avec précision sur cette puce :
- 136 cœurs Neoverse V3 répartis sur deux dies silicium distincts
- Fréquence : 3,2 GHz en base, boost à 3,7 GHz
- Cache : 2 Mo de cache L2 par cœur + 128 Mo de cache système partagé (SLC)
- Bande passante mémoire : 845 Go/s au total, soit 6 Go/s par cœur
- Latence mémoire : inférieure à 100 ns
- TDP : 300 W par puce
- Gravure : 3 nanomètres, réalisée par TSMC
Pour situer ces chiffres : la bande passante de 845 Go/s place l’AGI CPU dans une catégorie à part pour un processeur x86-compatible destiné aux serveurs. La latence sub-100 ns est critique pour les charges de travail multi-agents, où des milliers de requêtes s’enchaînent en parallèle.
💬 Notre analyse : Le choix des 136 cœurs Neoverse V3 n’est pas anodin. ARM aurait pu viser plus haut en nombre brut, mais la densité de cache — 2 Mo par cœur — et la bande passante mémoire trahissent une priorité claire : l’inférence IA à faible latence, pas le calcul brut. C’est une puce pensée pour orchestrer des agents, pas pour entraîner des modèles. Nuance importante que beaucoup de comparatifs oublient.
Des performances deux fois supérieures au x86 par rack
ARM annonce que l’AGI CPU offre plus de deux fois les performances par rack par rapport aux CPU x86 actuels dans les charges de travail IA agentiques.
Ce chiffre mérite d’être contextualisé. Il s’agit d’un ratio performances/consommation énergétique, pas de performances brutes en toutes circonstances. L’architecture ARM est historiquement plus efficiente en énergie — c’est précisément ce qui a conquis le marché mobile.
Dans un data center, l’énergie est un coût direct. Une puce qui fait le même travail en consommant deux fois moins d’électricité, c’est une économie considérable à l’échelle d’un rack de 36 kW.
Meta, OpenAI et Cloudflare : les premiers clients validés
ARM n’a pas lancé l’AGI CPU dans le vide. Plusieurs clients de premier plan ont déjà validé la puce :
- Meta est cité comme client principal et partenaire de développement — les rumeurs sur ce partenariat circulaient depuis un an avant l’annonce officielle
- OpenAI figure parmi les premiers adoptants
- Cloudflare complète ce trio de poids lourds
Ces noms ne sont pas anodins. Meta cherche à réduire sa dépendance aux puces Nvidia pour l’inférence. OpenAI a besoin de capacités de calcul massives et diversifiées. Cloudflare veut déployer l’IA au plus près de ses points de présence réseau mondiaux.
L’AGI CPU répond à un besoin réel, exprimé par des acteurs qui ont les moyens de leurs ambitions.
Les reference designs de racks : l’écosystème complet
ARM ne livre pas seulement une puce. La société propose deux reference designs de racks basés sur les standards Open Compute Project (OCP) :
- Rack dual-node de 36 kW, refroidi par air : 30 serveurs 1U dual-socket
- Rack haute densité à refroidissement liquide : configuration optimisée pour les déploiements à très haute densité
Cette approche « clé en main » est nouvelle pour ARM. Elle signale une ambition : ne plus seulement vendre une architecture, mais proposer une solution complète aux opérateurs de data centers.
Un bouleversement pour le marché des puces IA
Ce lancement redistribue les cartes sur un marché jusqu’ici dominé par quelques acteurs.
Intel et AMD voient un concurrent sérieux arriver sur leur terrain des serveurs. L’efficience énergétique de l’architecture ARM est un argument de poids dans un contexte où les data centers consomment des quantités d’énergie croissantes.
Nvidia est moins directement menacé — l’AGI CPU est un processeur, pas un GPU. Mais ARM entre dans l’écosystème des centres de données IA, un espace où Nvidia règne en maître. La cohabitation sera intéressante à observer.
Les licenciés ARM (Qualcomm, Amazon avec ses puces Graviton, Apple avec ses M-series) pourraient se retrouver dans une situation inconfortable. ARM devient à la fois leur fournisseur d’architecture et leur concurrent direct sur certains segments.
L’objectif : 15 milliards de dollars de revenus d’ici 2031
Ce pivot stratégique a une dimension financière claire. ARM vise 15 milliards de dollars de revenus additionnels d’ici 2031 grâce à sa nouvelle activité de production de silicium.
Pour référence, les revenus annuels d’ARM tournaient autour de 3 à 4 milliards de dollars avec son modèle de licences. L’objectif annoncé représente donc une transformation profonde du profil financier de l’entreprise.
Wall Street a salué l’annonce. Les investisseurs voient dans ce mouvement une manière pour ARM de capturer une plus grande part de la valeur qu’elle crée — au lieu de laisser ses licenciés empocher l’essentiel des marges sur les puces finales.
La livraison de l’AGI CPU aux premiers clients est prévue pour le deuxième semestre 2026.
Conclusion
L’ARM AGI CPU marque une rupture historique : après 35 ans à vendre des plans, ARM fabrique désormais ses propres puces. Avec 136 cœurs Neoverse V3, une bande passante de 845 Go/s et une efficience énergétique revendiquée deux fois supérieure au x86, cette puce cible précisément le goulot d’étranglement des data centers IA modernes — l’inférence agentique à grande échelle.
Ce que les concurrents n’ont pas assez souligné : le vrai risque pour ARM n’est pas technique, c’est relationnel. Ses licenciés historiques — Amazon, Qualcomm, Apple — sont désormais aussi ses concurrents potentiels. Comment ARM gérera cette tension déterminera autant son succès que les performances de la puce elle-même.
Prochaine étape : Approfondissez avec notre analyse de l’architecture Neoverse V3 et son positionnement face aux puces Graviton d’Amazon — deux visions opposées de l’efficience IA en data center.
