Message de Gate News, 29 avril — Les modèles d’OpenAI qui tournent sur Amazon Web Services’ Bedrock migreront progressivement vers Trainium, la puce IA conçue sur mesure par Amazon, d’après des remarques récentes du PDG d’OpenAI Sam Altman et de responsables d’AWS. À l’heure actuelle, les modèles fonctionnent dans un environnement mixte en utilisant à la fois des GPU et des Trainium, avec une part croissante qui se déplace vers Trainium au fil du temps. Altman a déclaré que l’entreprise « se réjouit de déplacer les modèles vers Trainium. »
Un responsable d’AWS, Garman, a reconnu que le nom de Trainium pouvait prêter à confusion, la puce étant conçue à la fois pour l’entraînement et l’inférence, l’inférence étant attendue comme principal cas d’usage à l’avenir. Toutefois, Garman a souligné que l’image de marque de la puce est largement sans importance pour la plupart des clients, notant que les utilisateurs interagissent avec OpenAI via son interface API plutôt qu’en contact direct avec le matériel sous-jacent. Lorsqu’on lui a demandé une éventuelle intégration future de modèles non-OpenAI dans Bedrock Managed Agents, Garman a refusé de fournir des détails, se contentant de dire qu’AWS se concentre actuellement sur son partenariat avec OpenAI.
La collaboration met en évidence la stratégie d’AWS consistant à tirer parti de sa silicon sur mesure pour prendre en charge les principales charges de travail IA sur sa plateforme cloud.