Artificial Analysis hat heute einen neuen Coding Agent Index veröffentlicht, um zu bewerten, wie gut KI-Modelle in Kombination mit Agenten-Frameworks über zentrale Benchmarks hinweg abschneiden, darunter SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 und SWE-Atlas-QnA. Zhipu GLM-5.1 belegte in der Auswertung den ersten Platz unter den Open-Source-Modellen und zeigte damit eine führende Performance in realen Coding-Agent-Szenarien.
Related News
OpenAI bringt ein Cybersicherheitsprogramm namens Daybreak heraus; die dreistufige Architektur von GPT-5,5 tritt gegen Anthropic Mythos an
Gemini – Komplettleitfaden 2026: Alle Google-AI-Produktlinien, Abo-Modelle und die Datenschutzrichtlinie – auf einen Blick
Stanford bringt Agent Island auf den Markt: KI-Modelle in einem Survivor-Style-Spiel, in dem es zu Strategieverrat und gegenseitigen Ausscheidungen kommt