Anthropic ClaudeがLLM向け新たなプロパガンダ耐性ベンチマークで首位に立つ

エストニア言語研究所によれば、政府が後援する組織が最近、「プロパガンダ耐性(Propaganda Resistance)」という新しいベンチマークのランキングを公開し、ロシアの戦略的な言説に立場を取らない能力について、大規模言語モデルを数十件評価した。最先端モデルの中では、AnthropicのClaudeモデルが最も好成績を収め、Claude Opus 4.7は100点満点中94.9点を獲得し、テスト質問の77%で「模範的(Exemplary)」の評価を受けた。このベンチマークでは、ロシアの影響作戦を14のカテゴリに分けてLLMの回答を評価し、クリミアの地位からNATOの歴史までのテーマを扱った。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし