Pourquoi les centres de données d’IA ne peuvent-ils pas se reposer uniquement sur les GPU ? Explorer la synergie entre mémoire, réseau et stockage

Marchés
Mis à jour: 30/06/2026 04:57

En juin 2026, le Bitcoin évoluait autour de la barre des 60 000 dollars, tandis que l’Ethereum se négociait dans la zone des 1 600 dollars, signalant une période de consolidation pour le marché des cryptomonnaies. À l’inverse, un autre secteur — l’infrastructure des centres de données dédiés à l’IA — connaissait une activité en forte hausse. Gartner prévoit que les dépenses mondiales en IT atteindront 6,31 trillions de dollars en 2026, soit une augmentation de 13,5 % sur un an, avec les systèmes de centres de données en tête de toutes les catégories, affichant un taux de croissance de 55,8 %. IDC anticipe que les dépenses mondiales des entreprises en IA atteindront 940 milliards de dollars en 2026.

Au cœur de cette course à la puissance de calcul, un changement de perspective s’opère : la compétitivité des centres de données IA ne se définit plus uniquement par le nombre de GPU ou la puissance de calcul maximale. L’attention se porte désormais sur la synergie globale entre calcul, stockage et réseau au sein des clusters. Comprendre comment la mémoire, le réseau et le stockage interagissent est devenu fondamental pour évaluer la valeur d’investissement dans l’infrastructure IA.

Le mur de la mémoire : premier goulot d’étranglement à l’ère des modèles de grande taille

La taille des paramètres des grands modèles IA a connu une croissance exponentielle au cours des deux dernières années. De 2024 à 2026, les paramètres des modèles principaux ont été multipliés par cent, et les fenêtres de contexte sont passées de dizaines de milliers à des millions de tokens. Pourtant, la bande passante mémoire des serveurs n’a progressé que de moins de 15 % par an, bien en deçà du rythme de la demande du secteur IA. Ce déséquilibre marqué entre l’évolution des logiciels et celle du matériel a fait du « mur de la mémoire » le principal goulot d’étranglement limitant la puissance de calcul IA.

Le mur de la mémoire désigne le fait que la vitesse de traitement des CPU/GPU augmente bien plus rapidement que la bande passante et la latence des accès mémoire. Alors que les puces de calcul fonctionnent à pleine vitesse, les données ne peuvent être fournies assez rapidement, obligeant les processeurs à attendre une grande partie du temps. Selon des rapports de tests industriels, dans les clusters GPU à grande échelle, les goulots d’étranglement liés à l’I/O des données peuvent entraîner un temps d’inactivité des GPU supérieur à 40 % — soit près de la moitié de ces puces coûteuses qui attendent le transfert des données.

Les ressources mémoire deviennent extrêmement rares. Un serveur d’inférence IA consomme plus de dix fois la DRAM et la HBM d’un serveur classique de centre de données, près de 60 % de la capacité mondiale de wafers DRAM étant désormais dédiée aux clusters IA. La HBM, en particulier, est en pénurie chronique, avec la majorité des capacités de production réservées par de grands clients jusqu’en 2026 voire 2027. Gartner souligne que la demande croissante et les contraintes d’approvisionnement ont fait grimper les prix de la HBM à des niveaux records, faisant de la mémoire un segment à forte marge pour les fabricants de semi-conducteurs.

Pour franchir le mur de la mémoire, l’industrie avance sur deux axes : d’une part, l’optimisation logicielle via le réglage fin et la compression, comme la gestion hiérarchisée du cache KV et la quantification en faible précision, afin de maximiser les ressources existantes ; d’autre part, l’innovation architecturale matérielle, incluant les évolutions de la HBM et l’adoption de nouveaux protocoles d’interconnexion mémoire tels que CXL (Compute Express Link). La plateforme HGX Rubin de prochaine génération de NVIDIA a triplé la bande passante mémoire GPU, atteignant 176 To/s. Ces deux approches ne sont pas exclusives ; elles sont complémentaires et redéfinissent la logique de collaboration entre stockage et calcul dans l’industrie.

Réseau : le « système nerveux » des clusters IA

Si la mémoire traite l’efficacité du transfert de données au sein d’un nœud, le réseau résout le défi du déplacement des données entre nœuds. Dans les clusters IA à grande échelle, des centaines voire des milliers de GPU doivent collaborer pour entraîner ou inférer un modèle unique, rendant l’efficacité de la communication inter-GPU cruciale pour la vitesse globale d’entraînement.

Les goulots d’étranglement de bande passante existent à plusieurs niveaux : entre les puces, les interconnexions PCB traditionnelles ne répondent plus aux exigences de bande passante élevée et de faible latence des puces IA ; au sein des racks serveurs, la bande passante inter-serveurs limite la montée en puissance verticale ; entre centres de données, la bande passante et la latence des transmissions longue distance limitent l’expansion horizontale et la gestion des charges de travail entre régions. On estime que, dans les clusters d’entraînement IA actuels, l’énergie consommée par le déplacement des données dépasse désormais celle du calcul lui-même.

NVLink et InfiniBand de NVIDIA dominent depuis longtemps le marché des interconnexions internes pour clusters IA. Le dernier NVLink Switch offre désormais une bande passante de 28,8 To/s, doublant la génération précédente. Cependant, ce paysage évolue : des entreprises comme AMD et Broadcom développent leurs propres solutions d’interconnexion, et des standards ouverts tels que UALink (Ultra Accelerator Link) arrivent à maturité rapidement. D’ici 2026, le secteur du réseau passera d’un modèle « NVIDIA exclusif » à une « concurrence multi-standards », ce qui élève le niveau d’exigence en matière d’intégration système pour les opérateurs de centres de données.

Stockage : du « entrepôt » à la « chaîne d’approvisionnement des données »

Dans les centres de données traditionnels, le stockage jouait le rôle d’« entrepôt » — principalement pour l’archivage et la conservation des données froides. Dans les centres de données IA, le stockage évolue en « chaîne d’approvisionnement des données » — chargé d’acheminer en continu les données d’entraînement vers les nœuds de calcul à des vitesses extrêmes et de garantir des lectures de paramètres de modèle à faible latence lors de l’inférence.

L’entraînement IA requiert un accès rapide à d’immenses volumes de données brutes, tandis que l’inférence exige une récupération rapide des poids de modèles et des caches KV. Les caches KV s’étendent désormais de la HBM GPU à la DRAM système, voire jusqu’aux SSD locaux à haute vitesse. Cela brouille la frontière entre stockage et mémoire, faisant des dispositifs de stockage non seulement des points d’arrivée des données, mais aussi des nœuds essentiels de la chaîne d’approvisionnement des données.

Le stockage tout-flash remplace les disques durs traditionnels comme choix dominant dans les centres de données IA. Lors de l’ISC High Performance 2026, Sugon a présenté des solutions tout-flash et des produits réseau natifs à haute vitesse, confirmant cette tendance sectorielle. Les performances de stockage déterminent désormais directement si les données parviennent à temps aux unités de calcul, impactant ainsi le taux d’utilisation des GPU.

Synergie calcul-mémoire-réseau : de la percée ponctuelle à l’optimisation systémique

Une fois les rôles et goulots d’étranglement de chaque composant clarifiés, la notion de « synergie » prend tout son sens : la véritable puissance de calcul d’un centre de données IA n’est pas la simple somme des performances GPU, de la bande passante mémoire, du débit réseau et des IOPS de stockage. Il s’agit plutôt du rendement effectif généré par le couplage systémique des quatre éléments.

La croissance continue des paramètres de modèles favorise l’émergence de super clusters IA. La facilité d’utilisation ne dépend plus uniquement des performances des puces, mais de plus en plus de la synergie et de l’efficacité globale entre calcul, stockage et réseau au sein du cluster. Cette vision s’impose rapidement comme consensus industriel.

En pratique, la conception intégrée calcul-mémoire-réseau est devenue la norme chez les principaux fournisseurs. Le supercluster scaleX AI de Sugon suit cette philosophie d’intégration serrée, augmentant significativement l’efficacité d’entraînement et d’inférence. Le système d’exploitation d’inférence Dynamo 1.0 de NVIDIA, associé à la plateforme BlueField-4 CMX, connecte de façon transparente GPU, HBM, DRAM hôte, flash local et stockage distant sur plusieurs niveaux, éliminant l’isolement mémoire GPU grâce à un routage automatisé des données chaudes et froides.

Le rapport IDC de juin 2026 est explicite : l’avantage concurrentiel en IA ne réside plus dans la puissance de calcul brute, mais dans la capacité à transformer l’IA en une compétence business durable au coût de token le plus bas. Au cœur du coût du token se trouvent les efficacités combinées du calcul, de la mémoire, du réseau et du stockage.

Panorama du marché : qui en profite ?

Cette tendance sectorielle se reflète déjà dans les marchés financiers.

Côté mémoire, SK Hynix s’impose comme la vedette de 2026. Le 22 juin 2026, l’action SK Hynix a bondi de 6 % à un record de 2 944 000 KRW, dépassant Samsung pour devenir la société cotée la plus valorisée de Corée, avec un gain de plus de 349 % depuis le début de l’année. Micron affiche également de solides résultats, avec un chiffre d’affaires trimestriel multiplié par plus de quatre lors de la dernière semaine de juin et l’annonce de 16 nouveaux contrats d’approvisionnement à long terme. Le cours de Micron a grimpé de 16 % le jour de la publication des résultats.

Dans le secteur réseau, le fournisseur de fibres optiques Corning a atteint un sommet historique lors de la dernière semaine de juin, le marché ayant revalorisé le rôle central de ses produits dans les centres de données IA. Les commandes d’infrastructure IA de Cisco ont dépassé les 9 milliards de dollars.

Du côté des serveurs et de l’intégration système, le chiffre d’affaires de Dell sur les serveurs optimisés IA a atteint 16,1 milliards de dollars sur un trimestre, soit une hausse de 757 % sur un an. Supermicro détient environ 70 % de part de marché sur la technologie de refroidissement liquide direct.

Pour les opérations de centres de données, BOCOM International cite GDS (GDS-SW) et SUNeVision (SUNEVISION) comme ses favoris du secteur, en raison de la croissance explosive de la demande générée par l’IA générative. UBS note également que l’industrie des centres de données internet en Chine accélérera fortement à partir du second semestre 2026.

Comment investir dans l’infrastructure IA via Gate ?

Gate propose désormais l’accès à plus de 12 500 actions et ETF sur les marchés américain, hongkongais et coréen. Les investisseurs peuvent utiliser un compte unifié pour négocier des actions mondiales directement en USDT et autres actifs numériques, permettant une allocation fluide entre cryptomonnaies et titres traditionnels.

Dans le secteur de l’infrastructure des centres de données IA, Gate couvre l’ensemble de la chaîne industrielle, des puces aux applications :

Pour les actions américaines, les investisseurs peuvent négocier les entreprises clés telles que NVIDIA (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Supermicro (SMCI), Corning (GLW) et Cisco (CSCO). Gate prend en charge les transactions pré-marché et après-marché, étendant les horaires de négociation à 16×5, permettant de réagir rapidement aux publications de résultats et aux données macroéconomiques.

Pour les actions hongkongaises, les investisseurs peuvent se concentrer sur les opérateurs de centres de données comme GDS (09698.HK) et SUNeVision (01686.HK).

Pour les actions coréennes, SK Hynix (000660.KS) est le leader incontesté de la HBM, tandis que Jeju Semiconductor joue un rôle clé en amont dans les matériaux de communication optique pour centres de données IA.

La négociation d’actions sur Gate propose des frais à partir de 0,1 %, prend en charge les modes de trading à effet de levier et au comptant, et les utilisateurs disposant de plus de 2 000 dollars de positions bénéficient de tarifs VIP exclusifs. Pour les investisseurs souhaitant une exposition systématique au secteur de l’infrastructure IA, les capacités de trading cross-market, multi-actifs et tout-en-un de Gate abaissent les barrières à l’allocation d’actifs technologiques mondiaux.

Conclusion

Les centres de données IA passent de l’ère du « stacking GPU » à une nouvelle phase d’optimisation systémique. Mémoire, réseau et stockage ne sont plus des composants isolés de l’infrastructure — ils sont désormais des variables du système qui, sous le prisme de la synergie calcul-mémoire-réseau, déterminent ensemble le rendement réel de la puissance de calcul IA.

Comprendre cette logique permet non seulement d’évaluer les tendances technologiques, mais aussi de disposer d’un cadre analytique solide pour les décisions d’investissement. Des puces à la mémoire, du réseau au stockage, des serveurs à l’exploitation des centres de données, toute la chaîne industrielle commence à être revalorisée. Alors que la volatilité à court terme du marché crypto croise le récit à long terme de l’infrastructure IA, une nouvelle fenêtre d’allocation entre actifs numériques et économie réelle s’ouvre.

FAQ

Q1 : Pourquoi les centres de données IA ne peuvent-ils pas résoudre les problèmes de puissance de calcul simplement en ajoutant plus de GPU ?

Les GPU ne sont que le point final de la production de calcul. Leur performance dépend fortement de la capacité de la bande passante mémoire à fournir les données à temps, de l’efficacité du réseau pour coordonner le parallélisme multi-GPU, et de la rapidité du stockage à gérer d’importants volumes de lecture et d’écriture. Dans les clusters GPU à grande échelle, les goulots d’étranglement liés à l’I/O des données peuvent entraîner plus de 40 % de temps d’inactivité des GPU — empiler les GPU sans traiter ces trois aspects conduit à un énorme gaspillage de puissance de calcul.

Q2 : Pourquoi la HBM est-elle en pénurie ?

La HBM (High Bandwidth Memory) est la mémoire standard des puces IA, avec des processus de fabrication complexes et des cycles d’expansion dépassant deux ans. En 2026, la demande d’inférence IA dépassera celle de l’entraînement, stimulant encore la demande de HBM et de DRAM à haute capacité. La plupart des capacités de production sont déjà réservées par de grands clients jusqu’en 2026 voire 2027, offrant peu de flexibilité d’approvisionnement à court terme.

Q3 : Quelle est la logique centrale de l’investissement dans l’infrastructure des centres de données IA ?

La logique centrale réside dans le passage d’une « domination de l’entraînement » à une « explosion de la demande sur toute la chaîne ». En 2026, Microsoft, Google, Amazon et Meta dépenseront collectivement 725 milliards de dollars en investissements d’infrastructure IA. Cette échelle d’investissement ne peut être supportée par un seul segment ; toute la chaîne de valeur — des puces et de la mémoire au réseau et à l’exploitation des centres de données — en bénéficie structurellement.

Q4 : Comment Gate permet-il la négociation d’actions liées à l’infrastructure des centres de données IA ?

Gate propose l’accès à plus de 12 500 actions et ETF américains, hongkongais et coréens. Les utilisateurs peuvent déposer en USDT et autres actifs numériques, et négocier les actions clés de l’infrastructure IA comme NVIDIA, Micron et SK Hynix via un compte unifié. Gate prend en charge les transactions pré-marché et après-marché, les modes à effet de levier et au comptant, avec des frais à partir de 0,1 %.

Q5 : Quels sont les principaux risques liés à l’investissement dans l’infrastructure des centres de données IA ?

Les principaux risques sont : (1) Les déséquilibres offre-demande peuvent entraîner des surcapacités temporaires — BOCOM International souligne la nécessité de surveiller les déséquilibres cycliques et les fluctuations de valorisation ; (2) La durabilité des investissements des fournisseurs cloud hyperscale — J.P. Morgan avertit que la croissance des dépenses d’investissement en 2025–2026 dépasse largement celle des revenus, mettant sous pression les flux de trésorerie ; (3) Les tensions géopolitiques et les contrôles à l’exportation pourraient perturber les chaînes d’approvisionnement de puces avancées.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Liker le contenu