Realität der KI-Agenten in Silicon Valley: Token werden massenhaft verschwendet, Systemintegration „extrem chaotisch“, Huan Renxun „das nächste ChatGPT“ – Vorhersage noch zu verifizieren

ChainNewsAbmedia

Laut einem ausführlichen Bericht von CNBC äußerten in den beiden diese Woche stattfindenden geschlossenen Treffen in Silicon Valley mehrere CEOs von KI-Start-ups und Ingenieure offen zwei große strukturelle Probleme bei der skalierbaren Bereitstellung von aktuellen KI-Agents: „massive Token-Verschwendung“ und „extreme Unordnung zwischen den Systemen“. Diese Vor-Ort-Aufzeichnungen stehen in starkem Kontrast zu den optimistischen Erwartungen, die Nvidia-CEO Jensen Huang im März geäußert hat, als er KI-Agents als „das nächste ChatGPT“ bezeichnete. Das zeigt, dass die praktischen Engpässe in diesem Bereich nicht in der Rechenleistung liegen, sondern in Entscheidungsdesign, Token-Effizienz und der Integration mehrerer Systeme.

Das größte Problem ist, alles an das LLM zu übergeben

Der CEO des KI-Start-ups Meibel, Kevin McGrath, stellte auf dem Treffen fest: „Das größte Problem, das wir gerade bearbeiten, ist, dass wir fälschlicherweise davon ausgehen, dass alle Dinge von einem großen Sprachmodell verarbeitet werden müssen — wir werfen alle Tokens und alles Geld in einen KI-Bot, und dann verbrennt er ein paar Millionen Tokens.“ Er betonte, dass Unternehmen bei der Gestaltung von Agent-Workflows klarer beurteilen müssen, welche Aufgaben wirklich ein LLM erfordern und welche sich mit deutlich günstigeren regelbasierten Logiken oder klassischem maschinellem Lernen erledigen lassen.

Diese Beobachtung spiegelt die Marktreaktion wider, nachdem das Enterprise-Angebot von Anthropic Claude auf nutzungsbasierte Abrechnung umgestellt hat — sobald der Token-Verbrauch direkt zu Kosten wird, zeigt sich der finanzielle Druck beim „blindlings an den Agent übergeben“-Entwicklungsmodell sofort. Meibels Sichtweise steht für eine Gruppe von Anti-Hype-Engineering-Praktikern: Die Kunst einer Agent-Architektur besteht darin, Grenzen zu setzen, nicht es laufen zu lassen.

Chaos durch gegenseitige Abhängigkeit in Multi-Agent-Kollaborationssystemen

Ein weiteres wiederkehrendes Schlüsselwort in dem CNBC-Bericht ist „chaotic“. Wenn Unternehmen gleichzeitig mehrere KI-Agents laufen lassen — zum Beispiel einen für den Kundendienst, einen für das Scheduling und einen für das Finanzwesen — beeinflussen sich die Nachrichtenübermittlung zwischen den Agents, die Konsistenz des Zustands sowie Fehlerbehebungen gegenseitig. Wenn ein Agent sich falsch verhält, löst das eine Kettenreaktion aus. Karpathy erwähnte diese Woche auch, dass er persönlich Workflows mit gleichzeitig 10–20 Agents betreibt, räumte jedoch ein, dass Code-Reviews und der PR-Prozess zur neuen Engstelle werden.

Das Chaos in solchen Multi-Agent-Systemen ist im Grunde das alte Problem verteilter Systeme, das sich im Zeitalter von LLMs wiederholt: Es gibt keine klaren SLAs, keine Transaktionsgrenzen, keine Semantik für fehlgeschlagene Retries. Obwohl Anthropic und OpenAI Protokollschichten wie MCP und Agent SDKs eingeführt haben, bleibt die Standardisierung bei der praktischen Einführung in Unternehmen weit hinter dem Wachstum der Anzahl von Agents zurück.

Abkühlung bei der 250.000-Dollar-Token-Gehaltstheorie

Nvidia-CEO Jensen Huang bewarb im März auf dem GTC und in nachfolgenden Interviews kräftig das Konzept der „Token-Gehälter“, indem er behauptete: „Wenn ein Ingenieur mit einem Jahresgehalt von 500.000 US-Dollar nicht mindestens 250.000 US-Dollar an Tokens verbraucht, wäre ich zutiefst beunruhigt.“ Seine Logik lautet: Ingenieure sollten KI-Agents anstelle ihrer eigenen niedrigwertigen Tätigkeiten einsetzen, und der absolute Token-Umsatz sei ein Stellvertretermaß für Produktivität. Diese Aussage findet sich in einem vollständigen Abschnitt zu den Anforderungen an KI-Rechenleistung in Huangs neuestem Interview (Teil 1).

Doch die Vor-Ort-Meinungen im CNBC-Bericht zeigen, dass das Ingenieurspublikum in Silicon Valley dieser Darstellung zunehmend skeptisch gegenübersteht: Die Menge der verbrauchten Tokens ist nicht gleichbedeutend mit Produktivität und könnte sogar ein Signal für ein schlecht gestaltetes Agent-Design sein. Der reale Wert von Ingenieuren liegt weiterhin darin, „welche Aufgaben man einen Agent nennen sollte, wie man Aufgaben zerlegt und wie man Fehlerbehandlung gestaltet“ — diese Arbeiten selbst lassen sich nicht anhand der Token-Menge messen.

Crypto und KI-Agents brauchen noch Zeit

Für die Crypto-Industrie basieren die Trends dieser Woche — dass KI 80% des globalen Venture Capitals verschlingt und DeFi-Projekte aktiv autonome Agents integrieren — auf der Voraussetzung, dass „Agent-Technologie bereits auf einem einsatzfähigen Niveau angelangt ist“. Doch der CNBC-Bericht erinnert daran: Selbst in einer reinen Web2-Unternehmensumgebung sind Token-Effizienz von Agents und die Integration mehrerer Systeme noch nicht stabil. Wenn man Agents in eine 7×24 laufende On-Chain-Umgebung einsetzt, in der Assets unmittelbar gestohlen werden können, werden sowohl technische Risiken als auch finanzielle Risiken verstärkt. Der eigentliche Startpunkt von Crypto × AI könnte noch auf die Reife der Standardisierung auf der Agent-Framework-Ebene warten (z. B. MCP, LangGraph, Cloudflare Agents).

Dieser Artikel „Die Realität von Silicon Valley KI-Agents: massive Token-Verschwendung, Systemintegration ‚extrem chaotisch‘, Huang „das nächste ChatGPT“ muss noch bestätigt werden“ erschien zuerst bei 鏈新聞 ABMedia.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare