Google bringt neue TPU-Chips der achten Generation auf den Markt: Verbesserte Preis-Leistungs-Effizienz, Trennung von Training und Inferenz

Gate News, Meldung vom 22. April — Google Cloud hat die Veröffentlichung seiner kundenspezifisch gebauten TPU (Tensor Processing Unit)-Chips der achten Generation am 22. April angekündigt. Die neue Produktlinie umfasst TPU 8t, die speziell für KI-Trainingsaufgaben entwickelt wurde, sowie TPU 8i, das für KI-Inferenz-Workloads optimiert ist. Beide Chips werden später in diesem Jahr verfügbar sein. Google hat außerdem neue Tools vorgestellt, um KI-Agenten zu bauen, und einen $750 Millionen-Fonds angekündigt, um die Einführung von Enterprise-KI voranzutreiben.

TPU 8t liefert 2,8-mal die Leistung der vorherigen Generation von Googles Ironwood-TPU zum gleichen Preisniveau. TPU 8i steigert die Leistung um 80% gegenüber dem Vorgänger und integriert eine statische Random-Access-Memory (SRAM)-Architektur, um „kosteneffizienten Durchsatz in großem Maßstab und geringe Latenz zu ermöglichen und damit zu erreichen, dass Millionen von Agenten gleichzeitig laufen können“, so CEO Sundar Pichai. Im Vergleich zu Ironwood erreichen beide TPU 8t und TPU 8i eine mehr als doppelt so hohe Energieeffizienz pro Watt: TPU 8t verbessert sich um 124% und TPU 8i um 117%. Google hat die Energieeffizienz über den gesamten Technologiestapel hinweg optimiert und integrierte dynamische Energiemanagementsysteme, die den Verbrauch anhand der aktuellen Nachfrage anpassen.

Googles eigene Modelle verarbeiten jetzt über 160 Milliarden Tokens pro Minute über direkte Kunden-API-Aufrufe, nach 100 Milliarden im letzten Quartal. KI erzeugt nun 75% sämtlichen neuen Codes bei Google, verglichen mit 50% im Herbst des vergangenen Jahres. Gemini Enterprise, Googles Angebot für Unternehmen, wuchs um 40% im Quartalsvergleich bei den bezahlten monatlich aktiven Nutzern. Das Unternehmen erwartet, bis 2026 etwas mehr als die Hälfte seines Machine-Learning-Compute-Budgets in Cloud-Dienste zu investieren, um Cloud-Kunden und -Partner besser zu bedienen. Google erweitert zudem seine Zusammenarbeit mit Broadcom, um kundenspezifische TPU-Chips für künftige Generationen zu entwickeln und bereitzustellen, während große Technologiefirmen nach Alternativen zu den teuren und lieferengpassbedingten GPUs von NVIDIA und AMD suchen.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

360 KI-Agent zur Schwachstellenentdeckung findet fast 1.000 Zero-Day-Exploits und tritt mit Mythos in Konkurrenz

360 Digital Securitys KI-gesteuerter Agent behauptet, etwa 1.000 neue Schwachstellen gefunden zu haben, darunter in Office und OpenClaw; KI ist jetzt zentral für die Entdeckung und Vorbereitung von Exploit-Ketten und steht damit im Wettbewerb mit Mythos. Zusammenfassung: Ein von Bloomberg zitierter Bericht stellt fest, dass der KI-gestützte Vulnerability Discovery Agent der 360 Digital Security Group in den letzten Monaten nahezu 1.000 zuvor unbekannte Schwachstellen identifiziert hat, darunter in Microsoft Office und im OpenClaw-Framework. Das Unternehmen sagt, KI sei zur zentralen Antriebseinheit der Schwachstellenentdeckung geworden, und habe ein KI-Tool angekündigt, um den Aufbau von Exploit-Ketten zu beschleunigen. Benincasa beschreibt 360 als Wettbewerber von Anthropics Mythos, basierend auf der Auswertung der chinesischsprachigen Mitteilungen des Unternehmens durch Natto Thoughts.

GateNews3M her

Yifan Zhang legt vollständige DeepSeek-V4-Spezifikationen offen: 1,6B Parameter, 384 Experten mit 6 Aktivierungen

Gate News Nachricht, 22. April — Der Princeton-Promotionsstudent Yifan Zhang hat auf X vollständige technische Spezifikationen für DeepSeek V4 offengelegt, nachdem es am 19. April eine Vorschau gegeben hatte. V4 verfügt über insgesamt 1,6 Billionen Parameter und eine leichte Variante, V4-Lite, mit 285 Milliarden Parametern. Das Modell verwendet die DSA2

GateNews1Std her

Anthropic-CEO bricht das Eis im Weißen Haus: Treffen mit dem Stabschef und Bessent zur Beratung über Mythos

Die „Wall Street Journal“ berichtet, dass der CEO von Anthropic, Amodei, am 17.4. im Weißen Haus zu einem vertraulichen Treffen zusammenkam und dabei den Sicherheitsrahmen von Mythos sowie eine verantwortungsvolle Bereitstellung in den Mittelpunkt stellte; das Weiße Haus sagte, das Treffen sei konstruktiv gewesen, der Markt sieht darin eine Entspannung der Beziehungen. Der Kernstreit besteht darin, dass die Streitkräfte Claude für alle rechtmäßigen Zwecke nutzen wollen, während Anthropic darauf besteht, dass der eigenen Richtlinien zur zulässigen Nutzung ein eigener Ermessensspielraum zugrunde liegt. Beide Seiten erklärten, sie würden den Dialog fortsetzen und vor dem Go-Live von Mythos im Mai erneut sprechen.

ChainNewsAbmedia2Std her

Google Ironwood TPU:10x Leistung + vier Partner im Kampf gegen Nvidia

Laut einem ausführlichen Bericht von Bloomberg und einer offiziellen Ankündigung von Google hat Google am 22. April offiziell sein eigenes KI-Chip-Portfolio erweitert: Der für Inferenzen ausgelegte Ironwood (die siebte Generation der TPU) wird in Google Cloud vollständig verfügbar gemacht, und gleichzeitig werden die nächsten Design-Kooperationen mit Broadcom, MediaTek, Marvell und Intel gestartet. Das Ziel ist es, mit einer maßgeschneiderten Chip-Lieferkette Nvidias dominierende Position im KI-Rechenleistungsmarkt herauszufordern. Ironwood: Siebte Generation TPU, erstmals speziell für Inferenz entwickelt Ironwood ist das Produkt der siebten Generation der Google-TPU-Serie und der erste Chip, der im Rahmen der Strategie „Training und Inferenz werden getrennt“ ausschließlich für Inferenz entwickelt wurde. Die von Google offengelegten Spezifikationen: Spitzenleistung pro Einzelchip bei T

ChainNewsAbmedia2Std her

DeepSeek führt Gespräche über die erste Runde externer Finanzierung, Bewertung 20 Milliarden US-Dollar: Chinas KI erreicht einen neuen Bewertungsrekord

Laut einem Bericht von Bloomberg vom 22. April (unter Berufung auf die exklusive Berichterstattung von The Information) befindet sich die chinesische KI-Startup DeepSeek in Gesprächen über eine erste externe Finanzierungsrunde, mit einer Bewertung von 20 Milliarden US-Dollar. Dies ist die erste externe Kapitalaufnahme für DeepSeek seit seiner Gründung im Jahr 2023; zuvor wurde es vollständig durch die interne Finanzierung des quantitativen Hedgefonds High-Flyer Capital Management finanziert. Eine Bewertung von 20 Milliarden US-Dollar ist außerdem ein Meilenstein dafür, dass ein chinesisches KI-Startup zum ersten Mal in die zweite Hälfte der Kategorie mit „Bewertungen im Bereich von über 10 Milliarden US-Dollar“ eintritt. Finanzierungsvolumen und Mittelverwendung DeepSeek strebt mindestens 300 Millionen US-Dollar für die erste Finanzierungsrunde an; die Bewertung von 20 Milliarden US-Dollar verdoppelt sich gegenüber der „Bewertung von über 10 Milliarden US-Dollar“, die am 17. April erstmals von The Information offengelegt wurde

ChainNewsAbmedia2Std her

Google bringt Tools für KI-Agenten auf den Markt, um Unternehmen dabei zu helfen, Aufgaben zu automatisieren

Google enthüllt Tools zum Bau von KI-Agenten, um Aufgaben zu automatisieren, den Fortschritt zu verfolgen und Workflows über dedizierte Agenten-Postfächer zu verwalten—mit Workspace-Updates und einer Vision, wie KI-Agenten die täglichen Routinen von Mitarbeitenden neu gestalten. Abstrakt: Google hat Tools vorgestellt, um KI-Agenten zur Aufgabenautomatisierung zu erstellen, ihren Fortschritt zu überwachen und Workflows zu optimieren, was auf Workspace-Updates und eine Zukunft hinweist, in der KI-Agenten die tägliche Arbeit verändern.

GateNews2Std her
Kommentieren
0/400
Keine Kommentare