Citi : le goulot d’étranglement de l’inférence IA passe des puces à l’alimentation et aux centres de données, les GPU A100 progressent de 11 % en six semaines

Selon des analystes de Citi, la demande pour l’IA en inférence reste forte, avec un goulot d’étranglement qui se déplace des puces avancées vers des GPU de génération plus ancienne et vers l’infrastructure électrique, a indiqué la banque le 16 juin, sur la base d’un rapport publié le 14 juin. Les prix des locations de GPU A100 ont augmenté de 11% sur six semaines, ce qui indique une demande durable au-delà du matériel le plus récent. La banque a noté que les contraintes de capacité des centres de données constituent désormais un défi majeur : un opérateur privé de neocloud a signé pour 4,9 GW de demande, mais a plus de 40 GW prévus dans son pipeline. La sélection des sites de centres de données dépend de plus en plus des coûts de l’électricité, autour de 9-12 cents par kilowatt-heure, de la disponibilité de l’énergie renouvelable et des accords d’achat d’électricité à long terme. Citi a déclaré que les coûts d’infrastructure pour l’IA continueront de grimper, à mesure que les dépenses en capital liées aux équipements, à l’accès à l’énergie et aux investissements d’infrastructure en phase initiale augmentent.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire