Artificial Analysisによると、最新のAI評価でClaude Opus 4.8は1タスクあたり$1.78のコストで56ポイントを獲得し、一方DeepSeek V4 Proはタスクあたり$0.04で44ポイントだった――Claudeの方が44倍高価です。この評価では、計画、ツールの使用、複雑なタスクの実行などの実世界での能力を測るためにベンチマークを見直し、より単純なマルチプルチョイスのテストを置き換えました。Claude Opus 4.8が利用可能なモデルで首位となり、その後にGPT-5.5が55ポイントで続きました。他の国内モデルも拮抗しており、MiniMax M3も44ポイント、Kimi K2.6は43ポイントでした。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。