Anthropic Claude übertrifft neue Benchmark für Propaganda-Widerstand bei LLMs

Laut dem Estnischen Sprachinstitut hat eine staatlich geförderte Organisation kürzlich einen neuen „Propaganda Resistance“-Benchmark veröffentlicht, in dem Dutzende großer Sprachmodelle nach ihrer Fähigkeit bewertet werden, keine Positionen zu russischen strategischen Narrativen einzunehmen. Anthropic-Claudemodelle schnitten bei den führenden Modellen am besten ab: Claude Opus 4.7 erzielte 94,9 von 100 Punkten und erhielt bei 77 Prozent der Testfragen eine Bewertung als „Vorbildlich“. Der Benchmark bewertete LLM-Antworten in 14 Kategorien russischer Einflussoperationen und umfasste Themen von der Einordnung der Krim bis hin zur NATO-Geschichte.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare