OpenAI’s GPT-5.5-Cyber erreicht 85,6% im CyberGym-Benchmark und übertrifft das von Anthropic gebannte Mythos-Modell

OpenAI kündigte am 22. Juni den vollständigen Rollout von GPT-5.5-Cyber an, im Rahmen seines Daybreak-Programms zur Cyberabwehr. Auf dem CyberGym-Benchmark – der KI-Agenten dabei testet, 1.507 bekannte Software-Schwachstellen aus 188 Open-Source-Projekten nachzubilden – erreichte das Modell 85,6% und lag damit vor Anthropics Mythos 5 mit 83,8% sowie Claude Opus 4.7 mit 73,1%.

Der Launch erfolgt, während Anthropics Mythos 5 und Fable 5 weiter offline bleiben, nachdem am 12. Juni ein Verbot der US-Regierung erlassen wurde, das nationale Sicherheitsbedenken und mögliche Jailbreak-Risiken anführt. Im Gegensatz dazu ist GPT-5.5-Cyber nur für verifizierte Sicherheitsfachleute verfügbar und wurde vorab von Bundesbehörden genehmigt, darunter das Office of the National Cyber Director. OpenAI hat mit Cybersecurity-Firmen einschließlich CrowdStrike, Cisco und Cloudflare zusammengearbeitet, um das Modell in deren Tools zu integrieren.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare