💀 R.I.P. ChatGPT: Grok 4 刚刚打破了每个 AI 基准 💀



xAI刚刚发布了有史以来最强大的AI模型!

经过几个月的期待,埃隆·马斯克的团队正式发布了Grok 4,基准数据绝对疯狂。它是新的SOTA大型语言模型。

Grok 4 提供了超越其他模型的最新能力:

🧠 人类最后的考试掌握 - 在有史以来最具挑战性的学术基准上取得了45%的准确率,而其他顶尖模型勉强达到25%。它在每个学术领域都超越了人类的专业知识。

🏆 人工分析第 #1 - 正式被认定为顶级 AI 模型,智力指数达到 73 分,超越了所有在推理、知识和解决问题能力方面的竞争对手。

🎯 ARC-AGI 冠军 - 在视觉模式识别中得分16.2%,几乎是Claude Opus 4表现的两倍。这个基准测量纯粹的智力和推理能力。

💻 编码主宰 - Grok 4 Code 变体在 SWE-Bench 上达到了 75%,在实际软件工程任务中超越了其他所有模型。直接集成到开发环境中。

⚡ 多智能体智能 - Grok 4 Heavy 利用协作 AI 代理解决复杂问题,使准确性超越任何单一模型所能达到的水平。

🔮 实时知识 - 与静态模型不同,Grok 4 访问来自 X 的实时数据,提供当前的信息和上下文,而其他 AI 则无法匹配。

🚀 经济天才 - 在商业模拟测试中超越了人类和所有 AI 模型,创造了比最近的竞争对手多 5 倍的收入。

🔧 API访问 - 每百万个令牌$3输入 / $15输出。反映高级能力的高级定价和用于处理大量文档的256k令牌上下文窗口。

⚡ 标准Grok 4 - 通过X Premium+订阅和Grok提供给希望获得世界级AI而不需要企业价格的用户。

💰 SuperGrok Heavy - 每月300美元,提前访问Grok 4 Heavy及其前沿功能。市场上最贵的AI订阅,但你为SOTA性能付费。

#aitools grok4 #artificialintelligence xAI #elonmusk machinelearning #technology LLM #technews
GROK-2.69%
JST5.55%
EVERY0.75%
XAI-0.25%
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)