Le thème officiel du Computex Taipei 2026 est « Connecting AI », mais le plus grand coup d’éclat est venu de la bombe pré-exposition du PDG de NVIDIA, Jensen Huang : le lancement de RTX Spark, la première superpuce IA basée sur Arm conçue spécifiquement pour les PC Windows. D’un point de vue industriel, cela était bien plus qu’un simple lancement de produit. Lorsqu’un pétaflop de calcul IA, un CPU Grace à 20 cœurs et jusqu’à 128 Go de mémoire unifiée sont intégrés dans un châssis d’ordinateur portable fin et léger, cela cristallise une question centrale qui traverse toute l’industrie de l’IA : l’inférence IA locale sur l’appareil est-elle enfin prête à rivaliser avec la puissance de calcul du cloud ? La relation entre le cloud et le calcul local est-elle un jeu à somme nulle, ou une évolution industrielle complémentaire ? Et pour les investisseurs, derrière ces deux voies, comment identifier, décomposer et allouer les priorités d’investissement dans l’IA en 2026 ?
Les véritables coordonnées du marché de l’IA sur l’appareil en 2026
Les discussions autour de l’IA sur l’appareil en 2024-2025 avaient encore une forte saveur narrative, mais en entrant en 2026, tous les points de données nécessaires au jugement ont une base quantifiable. Selon le rapport « Edge AI Hardware Market Report » de Mordor Intelligence, publié en janvier 2026, le marché du matériel IA en périphérie était évalué à environ 26,17 milliards de dollars en 2025 et devrait atteindre 30,74 milliards de dollars en 2026, pour atteindre environ 68,73 milliards de dollars d’ici 2031, avec un taux de croissance annuel composé (TCAC) d’environ 17,46 % de 2026 à 2031. En ce qui concerne le marché plus spécifique des puces IA en périphérie (hors matériel périphérique), les données de Research and Markets, publiées en février 2026, montrent des ventes d’environ 7,05 milliards de dollars en 2025, passant à 8,33 milliards de dollars en 2026, soit un TCAC d’environ 18,2 %. Bien que différentes agences rapportent des chiffres absolus différents en raison de périmètres statistiques distincts, le consensus directionnel est remarquablement cohérent : l’IA sur l’appareil est dans une trajectoire de forte croissance, avec un taux de croissance annuel attendu de 15 % à 20 % au cours des cinq prochaines années.
Un autre ensemble de données plus parlant provient des changements dans la pénétration des PC IA. Selon les estimations consensuelles de CITIC Securities et Soochow Securities, le taux de pénétration des puces IA pour les smartphones et les PC devrait atteindre respectivement 45 % et 62 % en 2026. La taille du marché mondial de l’IA sur l’appareil devrait passer de 321,9 milliards de RMB en 2025 à 1,22 billion de RMB d’ici 2029, un TCAC stupéfiant de 40 %. Au deuxième trimestre 2026, la part du traitement IA effectué côté appareil au niveau mondial a atteint 52 % pour la première fois, signalant que l’industrie entière a franchi le point d’inflexion critique de la « dépendance au cloud » au « déchargement local ». Les moteurs sous-jacents soutenant cette logique de pénétration incluent l’accélération tangible du cycle de mise à niveau des smartphones IA et des PC IA, les exigences rigides des réglementations sur la confidentialité et la sécurité des données favorisant le traitement local, et la diffusion à grande échelle de l’IA générative des applications cloud vers les appareils terminaux.
C’est le système de coordonnées fondamental pour comprendre la thèse d’investissement dans l’IA sur l’appareil : l’espace de marché est suffisamment grand, le taux de croissance suffisamment rapide, et les forces motrices forment déjà une base réaliste de convergence entre la politique, la technologie et la demande des utilisateurs, pas seulement un récit industriel.
Trois signaux industriels de RTX Spark
Dans ce contexte de marché, le lancement de RTX Spark prend une signification encore plus pénétrante. Ce SoC, construit conjointement par NVIDIA et MediaTek en utilisant le procédé avancé 3 nm de TSMC, n’est pas qu’une simple itération incrémentale dans les gammes de CPU existantes d’Intel ou d’AMD. C’est un produit phare qui ouvre de nouvelles voies, de son architecture sous-jacente à son positionnement sur le marché. En termes de spécifications, la variante phare de RTX Spark (série N1X) dispose d’un CPU NVIDIA Grace à 20 cœurs, d’un GPU architecture Blackwell (6144 cœurs CUDA), délivrant jusqu’à 1 pétaflop de calcul IA, associé à jusqu’à 128 Go de mémoire unifiée. La connexion entre le GPU et le CPU utilise NVLink-C2C, offrant une bande passante allant jusqu’à 600 Go/s, soit environ 5 fois celle du PCIe Gen5 traditionnel. Une version plus légère (série N1) cible le segment des ordinateurs portables fins et légers haute performance avec une consommation électrique comprise entre 18 W et 45 W. La première série d’ordinateurs portables équipés de ces puces devrait sortir à l’automne 2026 par des marques telles qu’ASUS, Dell, HP, Lenovo, Microsoft Surface et MSI.
Les signaux industriels de RTX Spark sont au nombre de trois. Premièrement, NVIDIA a officiellement étendu la compétition du calcul IA des centres de données et des clusters d’entraînement aux appareils de calcul grand public. Ces dernières années, Intel détenait un avantage significatif en tant qu’acteur établi sur le marché des CPU pour ordinateurs portables, tandis qu’AMD maintenait son avantage concurrentiel avec ses combinaisons CPU+GPU et sa technologie de procédé avancée. Le lancement de RTX Spark signale essentiellement que NVIDIA ne se contente plus de sa position dominante dans l’entraînement IA. Il pousse désormais activement l’inférence IA sur l’appareil comme une deuxième grande courbe de croissance parallèlement à son écosystème IA cloud. Deuxièmement, RTX Spark valide que les goulots d’étranglement physiques pour le déploiement de grands modèles sur l’appareil sont en train d’être résolus systématiquement. Auparavant, les contraintes principales entravant le déploiement à grande échelle de l’IA sur l’appareil se concentraient sur la consommation électrique, la dissipation thermique et la bande passante mémoire. RTX Spark atteint un calcul IA de niveau pétaflop dans un TDP de SoC inférieur à 80 W, tout en permettant une longue autonomie de batterie dans un châssis fin. Lorsqu’une puce d’ordinateur portable grand public peut exécuter localement un modèle de langage de 120 milliards de paramètres, le gradient de calcul entre l’IA sur l’appareil et l’IA cloud passe de « ne peut pas être remplacé » à « partiellement remplaçable » – une nouvelle phase pour l’industrie. Selon l’analyse de Yahoo Tech, la valeur fondamentale de RTX Spark réside dans le fait d’apporter des capacités IA de niveau serveur, auparavant réservées aux produits de bureau développeur DGX Spark de NVIDIA, à la plateforme d’ordinateur portable grand public. Combiné à la prise en charge native de Windows sur Arm, cela fournit la base matérielle pour que Microsoft reconstruise les capacités OS sous-jacentes pour les agents IA locaux.
Troisièmement, le lancement de RTX Spark renforce la certitude de la thèse d’investissement dans l’IA sur l’appareil. Lorsqu’un titan de l’industrie comme NVIDIA marque l’IA sur l’appareil comme une direction stratégique clé, le signal qu’il envoie est structurel. Cela indique que les perspectives de l’IA sur l’appareil ont atteint une échelle industrielle et une rationalité économique suffisantes pour soutenir une feuille de route produit à long terme. Cela conduit à un jugement fondamental : d’ici 2026, la thèse d’investissement pour l’IA sur l’appareil n’est plus de la science-fiction ; c’est une réalité reflétée dans les données de l’industrie et les feuilles de route produits.
La domination durable du cloud computing : le vrai poids révélé par les données
Dans l’évaluation de la thèse d’investissement dans l’IA sur l’appareil, un autre ensemble de données ne doit pas être ignoré : le volume pur de la puissance de calcul cloud reste bien plus important que celui du côté appareil. Selon un rapport de Morgan Stanley, les dépenses d’investissement combinées des 10 principaux fournisseurs de cloud au monde devraient atteindre 632 milliards de dollars en 2026. Le taux de croissance annuel composé du marché des puces IA cloud de 2024 à 2029 devrait encore dépasser 36 %. Rien qu’en considérant l’activité des centres de données de NVIDIA, son chiffre d’affaires cumulé pour 2026-2027 est projeté à des centaines de milliards de dollars. Dans les scénarios impliquant l’entraînement de grands modèles fondation, le traitement de tâches de raisonnement à contexte très long, ou l’interrogation de vastes bases de connaissances externes, les avantages d’échelle et d’élasticité de calcul du cloud ne seront pas remplacés par le côté appareil dans un avenir prévisible. L’entraînement cloud et l’inférence sur l’appareil ne sont pas des substituts ; ils opèrent à différents niveaux de demande du marché. L’évolution du calcul que NVIDIA conduit croît simultanément dans les deux directions : l’IA cloud soutient l’entraînement continu des grands modèles et les itérations de nouvelles architectures, tandis que l’IA sur l’appareil pousse la pénétration des capacités IA dans les appareils grand public quotidiens et le déchargement de tâches. Ce sont les extensions coordonnées du même écosystème de calcul à travers différents niveaux de marché, pas des forces opposées.
Sur ce point, un rapport de recherche de Soochow Securities offre un cadre dominant de l’industrie adopté par de multiples institutions. « Le but ultime des modèles sur l’appareil n’est pas de remplacer les grands modèles cloud », indique le rapport, « mais de former une architecture collaborative avec une division claire du travail avec le cloud. Les tâches à haute fréquence, légères et sensibles à la vie privée sont prioritaires pour un traitement local en boucle fermée sur l’appareil. Les tâches d’inférence lourdes, de génération longue et de calcul élevé sont empaquetées et planifiées sur l’appareil, puis envoyées au cloud pour exécution. » Ce jugement fournit la base logique pour allouer du poids entre les deux voies d’investissement.
Des feuilles de route de calcul à l’allocation d’actifs : la valeur passerelle de Gate Stock Trading
Une fois les deux voies d’investissement du calcul cloud et sur l’appareil décomposées logiquement, l’étape suivante inévitable atterrit sur une question pratique et exécutable : pour les investisseurs axés sur les tendances de l’industrie de l’IA, comment allouer efficacement les actifs clés de ces deux voies au sein d’un seul système de compte ?
Le 1er juin 2026, Gate a officiellement lancé son service de trading d’actions réelles, permettant aux utilisateurs de négocier directement des actions et des ETF des principaux marchés de valeurs américains en utilisant USDT au sein de la plateforme. La principale différence de ce service réside dans sa nature de produit. Les utilisateurs achètent de véritables actifs sous-jacents qui se négocient en synchronisation sur le NASDAQ et le NYSE. Ces actifs sont conservés par un courtier membre de la SIPC (Société de protection des investisseurs en valeurs mobilières), et les utilisateurs détiennent de véritables certificats de propriété. C’est une distinction fondamentale par rapport aux actions tokenisées courantes ou aux contrats perpétuels sur actions, qui sont des dérivés conçus principalement pour le suivi des prix.
Le trading d’actions réelles de Gate prend actuellement en charge plus de 10 000 actions et ETF, couvrant les principaux marchés de valeurs américains et les réseaux de liquidité, y compris la Bourse de New York (NYSE), le NASDAQ, NYSE Arca, NYSE American et BATS. Les utilisateurs peuvent gérer à la fois les actifs crypto et les actions de manière unifiée dans un seul compte Gate, permettant une allocation flexible d’actifs intersectorielle en fonction de l’évolution des conditions du marché. Pour les investisseurs cherchant à construire un portefeuille diversifié dans différentes directions de l’espace de calcul IA, la valeur du service d’actions de Gate réside dans le fait de fournir une passerelle de trading intégrée sans avoir à basculer constamment entre les marchés des cryptomonnaies et les marchés financiers traditionnels.
La logique d’allocation des deux voies et la valeur passerelle de la plateforme Gate
En synthétisant tous les jugements ci-dessus, la logique d’investissement pour l’IA sur l’appareil et la puissance de calcul cloud peut être formulée comme suit.
D’un point de vue structurel de la croissance du calcul, le centre de gravité des charges de travail IA se déplace du côté de l’entraînement vers le côté de l’inférence. L’inférence implique à la fois un déploiement à grande échelle dans les centres de données cloud et une inférence localisée sur l’appareil. La voie sur l’appareil bénéficie du cycle de mise à niveau des PC IA et des téléphones IA, de la pénétration rapidement croissante des puces IA sur l’appareil, et de l’enfoncement des capacités IA dans divers secteurs verticaux, des wearables aux véhicules intelligents. Les moteurs centraux pour la voie cloud sont la haute prospérité soutenue des dépenses d’investissement des centres de données, les économies d’échelle pour les clusters d’entraînement, et l’effet de diffusion de l’infrastructure IA dans les applications industrielles.
En termes de sélection d’objectifs d’investissement, la direction de l’IA sur l’appareil pourrait se concentrer sur les entreprises de conception de puces IA (NVIDIA, AMD, Qualcomm), les principaux soutiens de l’écosystème de l’architecture Arm, ainsi que les fonderies de procédés avancés (comme TSMC) et les fournisseurs de mémoire à large bande passante (comme SK Hynix). La direction de l’IA cloud pourrait se concentrer sur la chaîne d’approvisionnement des serveurs IA, les fournisseurs d’équipements de réseau pour centres de données, et les entreprises leaders dans l’espace de l’infrastructure cloud computing. Sur la plateforme de trading d’actions de Gate, les principales sociétés cotées des deux voies sont déjà couvertes. Les utilisateurs n’ont pas besoin d’ouvrir plusieurs comptes de courtage ; ils peuvent réaliser une allocation intégrée au sein d’un seul compte Gate.
Au-delà du trading d’actions, Gate, en tant que plateforme de services financiers complète dans l’industrie crypto, continue d’étendre les frontières de son écosystème. La plateforme a été fondée en 2013 par son PDG, le Dr Han. Aujourd’hui, elle compte plus de 54 millions d’utilisateurs enregistrés dans le monde, avec un volume de trading au comptant se classant constamment parmi les trois premiers mondiaux. La plateforme prend en charge le trading de plus de 4 700 actifs crypto et plus de 10 000 actifs boursiers, dédiée à offrir aux utilisateurs une expérience d’allocation d’actifs multi-classes intégrée. Gate a été parmi les premiers à mettre en œuvre une preuve de réserves à 100 %. Au 16 mars 2026, le ratio de réserves global est d’environ 122 %, dépassant largement le seuil de sécurité de l’industrie de 100 %, couvrant près de 500 types différents d’actifs utilisateur.
Conclusion
La compétition entre l’IA sur l’appareil et la puissance de calcul cloud n’est pas un choix binaire. En 2026, l’industrie de l’IA est à un tournant historique où les voies cloud et sur l’appareil s’accélèrent simultanément. L’IA sur l’appareil pousse la pénétration des capacités IA vers les appareils grand public quotidiens, annonçant un passage de « bien utiliser l’IA » à « l’IA partout ». L’IA cloud soutient l’évolution continue des très grands modèles et la lourde charge des tâches d’inférence à grande échelle.
D’un point de vue investissement, chaque voie a son propre potentiel de croissance et ses caractéristiques de risque. La flexibilité d’investissement de la voie sur l’appareil dépend davantage de l’incrément déterministe provenant de la hausse de la pénétration des terminaux IA et de l’avancement continu de la puissance de calcul sur l’appareil. La logique d’investissement de la voie cloud repose sur la haute prospérité soutenue de l’investissement dans l’infrastructure des centres de données. Lorsque RTX Spark de NVIDIA comprime du calcul de niveau centre de données dans un ordinateur portable fin et léger, et lorsque le traitement IA sur l’appareil dépasse le traitement cloud pour la première fois, la direction pointée par les données est claire. La double logique de l’investissement dans le calcul n’est pas la fin du consensus de marché, mais le point de départ d’une nouvelle série de jugements industriels.
Avertissement de risque : ce contenu est à titre informatif uniquement et ne constitue pas un conseil en investissement. Le trading d’actions comporte des risques de marché, et le marché des cryptomonnaies est très volatil. Le service de trading d’actions réelles de Gate est connecté au marché des valeurs américaines via le courtier conforme Alpaca ; les utilisateurs achètent de véritables actifs sous-jacents. Veuillez prendre des décisions judicieuses en fonction de votre propre tolérance au risque.




