谷歌推出第八代 TPU 芯片:性能价格比提升,训练与推理分离

Gate News 消息,4 月 22 日——谷歌云宣布,于 4 月 22 日发布其第八代自研 TPU (Tensor Processing Unit) 芯片。新的产品线包括 TPU 8t,专为 AI 训练任务设计,以及 TPU 8i,针对 AI 推理工作负载进行了优化。两款芯片都将在今年晚些时候提供。谷歌还发布了用于构建 AI 代理的新工具,并宣布了一笔 $750 百万美元基金来推动企业采用 AI。

TPU 8t 在相同价格水平下,性能是谷歌上一代 Ironwood TPU 的 2.8 倍。TPU 8i 相比其前代性能提升 80%,并采用静态随机存取存储器 (SRAM) 架构,以实现“具成本效益的大规模吞吐和低延迟,从而让数百万个代理能够同时运行”,据首席执行官 Sundar Pichai 介绍。与 Ironwood 相比,TPU 8t 和 TPU 8i 的能效表现均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。谷歌在整个技术栈范围内优化了能效,并集成动态电源管理系统,根据实时需求调整功耗。

谷歌的自有模型现已通过直接客户 API 调用,每分钟处理超过 1600 亿个 token,高于上季度的 1000 亿。如今,在谷歌上生成的所有新代码中,AI 占比达到 75%,而去年秋季为 50%。Gemini Enterprise 是谷歌的企业产品,其付费月活用户环比增长 40%。公司预计到 2026 年将把其机器学习计算预算中略多于一半投入云服务,以更好地服务云客户和合作伙伴。谷歌还在扩大与博通(Broadcom)的合作,以为未来代次开发并供应用于定制的 TPU 芯片,因为主要科技公司正在寻求替代从 NVIDIA 和 AMD 获取的昂贵且供应受限的 GPU。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات