GLM 5.2、学術論文の再現コストをClaude Opus 4.8 Maxの8分の1に削減

Beatingによると、学術的な再現テストにおいて、自己蒸留強化学習論文を再現する際、GLM 5.2はわずか6.21ドルのコストで達成したのに対し、Claude Opus 4.8 Maxは46.35ドルかかった。オープンソースモデルは成功までに14回の失敗を要し、265万トークンを消費した。一方、Opusは9回の失敗の後にタスクを完了し、453万トークンを使用した。これはalphaXivチームの自動エージェントテストによる。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし