GPT 排第 9,DeepSeek 压过 Claude,最强交易 Agent 竟是「过时」的 4.6

深潮 TechFlow 消息,5 月 13 日,由 Manic.Trade 发起的 AI 交易 Agent 基准测评 SMART Benchmark 已正式收官。本次测评共完成 387 次评估,覆盖 180 名测试者、46 个模型及 15+ 模型家族,为目前涵盖模型最多的交易 Agent 横向评测。主要围绕实时数据处理、多源情报获取、市场分析、交易决策和风险控制五个维度展开。

结果显示,Claude 家族以 75.9 分排名第一,DeepSeek 以 74.4 分排名第二,GPT 家族则仅位列第九。单模型方面,Claude 4.7 Opus 以 80.8 分成为平均分最高的模型;DeepSeek V4 Pro 以 78.6 分排名第二;Claude 4.6 Opus 以 78.5 分排名第三,并贡献了全场唯一一次 S 级成绩,最高分达到 90/100。

值得注意的是,DeepSeek 在 Market Analysis 维度得分 15.9,超过 Claude 的 15.4。Manic.Trade 表示,本次测评显示,当前 AI 交易 Agent 的差距并不主要体现在能否做出交易决策,而是体现在多源信息整合、可验证数据处理和风险控制等更接近真实交易执行的能力上。

目前,用户可访问 Manic.Trade 查看完整报告,并体验面向人类交易员和 AI Agent 的加密价格预测市场。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论