Sendehinweis, 23. April — Das Forschungsteam von Perplexity veröffentlichte einen technischen Artikel, der seine Post-Training-Methodik für Web-Search-Agenten im Detail beschreibt. Der Ansatz nutzt zwei Open-Source-Qwen3.5-Modelle (Qwen3.5-122B-A10B und Qwen3.5-397B-A17B) und setzt auf eine Zwei-Phasen-Pipeline: Supervised Fine-Tuning (SFT), um regelkonformes Befolgen von Anweisungen und sprachliche Konsistenz zu etablieren, gefolgt von Online Reinforcement Learning (RL), um Suchgenauigkeit und Tool-Use-Effizienz zu optimieren.
Die RL-Phase nutzt den GRPO-Algorithmus mit zwei Datenquellen: einen proprietären Multi-Hop-verifizierbaren Frage-Antwort-Datensatz, der aus internen Seed-Queries erstellt wurde, die 2–4 Reasoning-Hops mit Multi-Solver-Verifikation erfordern, sowie rubrikbasierte allgemeine Konversationsdaten, die die Einsatzanforderungen in objektiv prüfbare atomare Bedingungen umwandeln, um eine Degradation des SFT-Verhaltens zu verhindern.
Das Reward-Design verwendet gated Aggregation — Preferences-Scores tragen nur bei, wenn die Baseline-Korrektheit erreicht ist (question-answer match oder alle Rubrik-Kriterien erfüllt), wodurch verhindert wird, dass starke Preference-Signale faktische Fehler überdecken. Effizienz-Strafen verwenden innerhalb von Gruppen verankertes Ankern: Es werden glatte Strafen für Tool-Calls und für die Generationslänge angewendet, die die Baseline der korrekten Antworten in derselben Gruppe überschreiten.
Die Evaluierung zeigt, dass Qwen3.5-397B-SFT-RL eine erstklassige Performance über Such-Benchmarks hinweg erreicht. Bei FRAMES erzielt es 57,3% Genauigkeit mit einem einzelnen Tool-Call und übertrifft GPT-5.4 um 5,7 Prozentpunkte sowie Claude Sonnet 4.6 um 4,7 Prozentpunkte. Bei moderatem Budget (vier Tool-Calls) erreicht es 73,9% Genauigkeit bei $0.02 pro Query, im Vergleich zu GPT-5.4s 67,8% Genauigkeit bei $0.085 pro Query und Sonnet 4.6s 62,4% Genauigkeit bei $0.153 pro Query. Die Kostendaten basieren auf der öffentlich verfügbaren API-Preisgestaltung jedes Anbieters und schließen Caching-Optimierungen aus.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Google-CEO: 2026 belaufen sich die Investitionen auf 1850 Milliarden, die Investitionen in das Zeitalter der KI-Agenten werden aufgestockt
Der CEO von Google, Sundar Pichai, gab am 22. April auf der Google Cloud Next-Konferenz in Las Vegas bekannt, dass Google im Jahr 2026 175 bis 185 Milliarden US-Dollar an Investitionsausgaben (CapEx) für den Aufbau der Infrastruktur bereitstellen will, die für autonome KI-Agenten (AI Agent) erforderlich ist, was gegenüber 2022 (31 Milliarden US-Dollar) eine Steigerung darstellt.
MarketWhisper21M her
Google Jules veröffentlicht eine neue überarbeitete Kandidatenliste für die offene Version und positioniert sich neu als End-to-End-Produktentwicklungsplattform
Laut der offiziellen Ankündigung des Google-Jules-Teams vom 23. April wurde die Produktpositionierung von Jules von einem „asynchronen Coding-Agent“ auf eine „End-to-End-agentische Produktentwicklungsplattform“ aktualisiert. Die neue Version kann den vollständigen Produktkontext lesen, trifft eigenständig Entscheidungen über die nächste Konstruktionsrichtung und reicht PRs ein. Offiziell wurde außerdem die Freigabe einer neuen Kandidatenliste für die neue Version bekanntgegeben.
MarketWhisper27M her
Google Jules wird als End-to-End-agentic Produktentwicklungsplattform umpositioniert und eröffnet Warteliste für neue Version
Gate News Meldung, 23. April — Das Team von Googles Jules gab die Eröffnung einer Warteliste für eine neue Version des Produkts bekannt und positioniert Jules von einem asynchronen Coding-Agenten zu einer End-to-End-agentic Produktentwicklungsplattform neu. Laut der offiziellen Beschreibung liest die aufgerüstete Plattform den gesamten Produktkontext, bestimmt, was als Nächstes gebaut werden sollte, schlägt Lösungen vor und reicht Pull Requests ein.
GateNews1Std her
OpenAI Codex Team behebt OpenClaw-Authentifizierungsfehler und verbessert das Verhalten von Agenten deutlich
OpenClaw wechselt von der Pi- auf die Codex-Engine, um ein stilles Authentifizierungs-Fallback zu beheben; zwei PRs adressieren die Bridge und das Fallback. Nach der Behebung wechselt der Agent von oberflächlichem Heartbeat-Polling zu einer vollständigen Work-Loop, wodurch Fortschritt ermöglicht wird.
Abstrakt: Die Optimierung der OpenClaw-Codex-Engine hat einen kritischen Authentifizierungsfehler behoben, der bei der Verwendung von Codex mit OpenAI-Modellen zu einem stillen Fallback auf die Pi-Engine führte. Zwei Pull Requests beheben die Authentifizierungs-Bridge und verhindern das stille Fallback, indem der Runtime-Adapter geändert wird. Dadurch entwickelt sich das Verhalten des Agents von oberflächlichem Heartbeat-Polling zu einer vollständigen Work-Loop: Der Agent liest den Kontext, analysiert Aufgaben, bearbeitet Repositories und überprüft den Fortschritt, wodurch die Kontinuität und Sichtbarkeit über Heartbeats hinweg verbessert wird.
GateNews2Std her
OpenAI führt ChatGPT-Workspace-Agents ein: Codex-gesteuert, gemeinsamer Teamzugriff, Slack-Integration
OpenAI hat am 22. April in ChatGPT Business/Enterprise/Edu/Teachers WorkspaceAgents eingeführt. Angetrieben von Codex, mit Cloud-Langzeitbetrieb, gemeinsamer Nutzung im Team und auch offline ausführbar, kann es proaktiv auf Slack reagieren und Rechnungen erstellen, mehrschrittige Workflows ausführen und Unterstützung für die Planung bieten. Die Forschungs-Vorschau ist kostenlos bis zum 6. Mai; danach erfolgt die Abrechnung auf Basis von Credits, der Preis wird noch bekanntgegeben. Im Wettbewerb mit dem GoogleGeminiEnterpriseAgentPlatform und dem AnthropicClaudeCowork, mit denen die drei Anbieter jeweils auf Agenten für Unternehmen setzen, aber unterschiedlich positioniert sind.
ChainNewsAbmedia3Std her
Google Cloud Next 2026: Einführung der Gemini-Unternehmens-Agentenplattform, 750 Millionen USD zur Unterstützung von Beratern bei der Umsetzung
Google Cloud hat auf der Cloud Next 2026 die Gemini Enterprise Agent Platform vorgestellt. Sie integriert die Modellauswahl, den Aufbau von Agenten, DevOps, Orchestrierung und unternehmensweite Sicherheitskontrollen und bietet einen Fonds in Höhe von 750 Millionen US-Dollar, um McKinsey, Accenture und Deloitte bei der Bereitstellung unternehmensweiter Agenten zu unterstützen. Die Plattform ist mit Ironwood TPU, A2A und MCP gekoppelt, um ein eigenes Full-Stack- und Berater-Ökosystem aufzubauen und sich gegen OpenAI Operator und Anthropic Claude in der Unternehmensversion zu behaupten.
ChainNewsAbmedia3Std her