Message Gate News, 22 avril — Google Cloud a annoncé la sortie de ses puces TPU (Tensor Processing Unit) sur mesure de 8e génération, le 22 avril. La nouvelle gamme comprend TPU 8t, conçu spécifiquement pour les tâches d’entraînement à l’IA, et TPU 8i, optimisé pour les charges de travail d’inférence IA. Les deux puces seront disponibles plus tard cette année. Google a également dévoilé de nouveaux outils pour construire des agents d’IA et annoncé un fonds $750 million pour accélérer l’adoption de l’IA en entreprise.
TPU 8t offre 2,8 fois les performances de l’ancienne TPU Ironwood de génération précédente de Google au même niveau de prix. TPU 8i améliore les performances de 80% par rapport à son prédécesseur et intègre une architecture de mémoire vive statique à accès aléatoire (SRAM) pour fournir « un débit à grande échelle rentable et une faible latence, permettant à des millions d’agents de fonctionner simultanément », selon le PDG Sundar Pichai. Par rapport à Ironwood, les TPU 8t et TPU 8i atteignent toutes deux plus du double de l’efficacité performance-par-watt, avec une amélioration de 124% pour TPU 8t et de 117% pour TPU 8i. Google a optimisé l’efficacité énergétique sur l’ensemble de la pile technologique et intégré des systèmes de gestion dynamique de l’alimentation qui ajustent la consommation selon la demande en temps réel.
Les modèles first-party de Google traitent désormais plus de 160 milliards de tokens par minute via des appels directs à l’API client, contre 100 milliards le trimestre dernier. L’IA génère désormais 75% de tout le nouveau code chez Google, contre 50% à l’automne de l’année dernière. Gemini Enterprise, l’offre entreprise de Google, a progressé de 40% d’un trimestre sur l’autre en utilisateurs actifs mensuels payants. L’entreprise s’attend à investir légèrement plus de la moitié de son budget de calcul pour l’apprentissage automatique dans des services cloud d’ici 2026 afin de mieux servir les clients cloud et les partenaires. Google étend aussi sa collaboration avec Broadcom pour développer et fournir des puces TPU sur mesure pour les générations futures, alors que de grandes entreprises technologiques recherchent des alternatives aux GPU coûteux et contraints en approvisionnement de NVIDIA et AMD.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
L’agent de découverte de vulnérabilités par IA de 360 trouve près de 1 000 exploits de type zero-day, en concurrence avec Mythos
L’agent piloté par IA de 360 Digital Security affirme avoir découvert environ 1 000 nouvelles vulnérabilités, notamment dans Office et OpenClaw ; l’IA est désormais au cœur de la découverte et de la préparation de la chaîne d’exploitation, rivalisant avec Mythos.
Résumé : Un rapport cité par Bloomberg indique que l’agent de découverte de vulnérabilités piloté par IA de 360 Digital Security Group a identifié près de 1 000 vulnérabilités auparavant inconnues ces derniers mois, notamment dans Microsoft Office et le framework OpenClaw. La société affirme que l’IA est devenue le moteur central de la découverte des vulnérabilités et a annoncé un outil d’IA pour accélérer la construction des chaînes d’exploitation. Benincasa décrit 360 comme un concurrent de Mythos d’Anthropic, sur la base de la revue des annonces en langue chinoise de la société par Natto Thoughts.
GateNewsIl y a 3m
Yifan Zhang divulgue les spécifications techniques complètes de DeepSeek V4 : 1,6T paramètres, 384 experts avec 6 activations
Message de Gate News, 22 avril — Le doctorant de Princeton Yifan Zhang a divulgué sur X les spécifications techniques complètes de DeepSeek V4, après un aperçu le 19 avril. V4 affiche 1,6 trillion de paramètres au total et une variante légère, V4-Lite, avec 285 milliards de paramètres.
Le modèle emploie le mécanisme d’attention DSA2
GateNewsIl y a 1h
Le PDG d’Anthropic se rend à la Maison-Blanche pour briser la glace : échanges avec le chef de cabinet et Bezner autour de Mythos
Le Wall Street Journal rapporte que le PDG d’Anthropic, Amodei, a rencontré le 17/04 le gouvernement de la Maison-Blanche à huis clos, en se concentrant sur les limites de la sécurité nationale et sur un déploiement responsable de Mythos ; la Maison-Blanche affirme que la réunion a été constructive, tandis que le marché y voit un signe de dégel des relations. Le principal point de divergence est que l’armée veut que Claude soit autorisé pour tous les usages légaux, tandis qu’Anthropic insiste sur le fait que sa propre politique d’utilisation acceptable relève de son pouvoir discrétionnaire. Les deux parties ont déclaré vouloir poursuivre le dialogue, avant de reparler avant le lancement de Mythos en mai.
ChainNewsAbmediaIl y a 2h
Google Ironwood TPU : 10 fois les performances + quatre partenaires contre Nvidia
Selon un reportage approfondi de Bloomberg et une annonce officielle de Google, Google a officiellement élargi le 22 avril sa gamme de puces d’IA conçues en interne : l’Ironwood, dédié au calcul d’inférence (TPU de septième génération), est désormais disponible à grande échelle sur Google Cloud, et le groupe lance en parallèle des collaborations de conception de prochaine génération avec Broadcom, MediaTek, Marvell et Intel. L’objectif est de contester de front la position dominante de Nvidia sur le marché des capacités de calcul pour l’IA via des chaînes d’approvisionnement de puces sur mesure.
Ironwood : TPU de septième génération, première puce conçue spécifiquement pour l’inférence
Ironwood est le produit de septième génération de la gamme de TPU de Google, et la première puce dédiée à l’inférence dans le cadre de la stratégie « séparation entre entraînement et inférence ». Les spécifications révélées par Google : la performance de pointe par puce est de T
ChainNewsAbmediaIl y a 2h
DeepSeek discute d’un premier tour de financement externe, valorisation 20 milliards de dollars : nouveau sommet pour l’évaluation de l’IA en Chine
Selon un article de Bloomberg du 22 avril (y compris l’exclusivité de The Information), la startup chinoise d’IA DeepSeek est en discussions pour un premier tour de financement externe, avec une valorisation atteignant 20 milliards de dollars. C’est la première levée de fonds externe pour DeepSeek depuis sa création en 2023 ; auparavant, l’entreprise était entièrement financée en interne par le fonds spéculatif quantitatif High-Flyer Capital Management. Une valorisation de 20 milliards de dollars constitue également une étape marquante pour les startups chinoises d’IA, en étant pour la première fois dans la seconde moitié de la fourchette « valorisation de 100 milliards de dollars » de référence.
Montant du financement et utilisation des fonds
DeepSeek cherche au moins 300 millions de dollars pour son premier tour de financement ; la valorisation de 20 milliards de dollars double à nouveau par rapport à l’évaluation « supérieure à 10 milliards de dollars » divulguée pour la première fois plus tôt le 17 avril par The Information.
ChainNewsAbmediaIl y a 2h
Google lance des outils d’agents d’IA pour aider les entreprises à automatiser des tâches
Google dévoile des outils pour créer des agents d’IA afin d’automatiser des tâches, de suivre l’avancement et de gérer les flux de travail via des boîtes de réception d’agents dédiées, avec des mises à jour de Workspace et une vision d’agents d’IA qui transforment les routines quotidiennes des employés.
Résumé : Google a présenté des outils pour créer des agents d’IA destinés à l’automatisation des tâches, au suivi de leur progression et à la rationalisation des flux de travail, annonçant des mises à jour de Workspace et un futur où les agents d’IA transforment le travail quotidien.
GateNewsIl y a 2h