💀 R.I.P. ChatGPT: Grok 4 剛剛打破了每個 AI 基準 💀



xAI剛剛發布了有史以來最強大的AI模型!

經過幾個月的期待,埃隆·馬斯克的團隊正式發布了Grok 4,基準數據絕對瘋狂。它是新的SOTA大型語言模型。

Grok 4 提供了超越其他模型的最新能力:

🧠 人類最後的考試掌握 - 在有史以來最具挑戰性的學術基準上取得了45%的準確率,而其他頂尖模型勉強達到25%。它在每個學術領域都超越了人類的專業知識。

🏆 人工分析第 #1 - 正式被認定爲頂級 AI 模型,智力指數達到 73 分,超越了所有在推理、知識和解決問題能力方面的競爭對手。

🎯 ARC-AGI 冠軍 - 在視覺模式識別中得分16.2%,幾乎是Claude Opus 4表現的兩倍。這個基準測量純粹的智力和推理能力。

💻 編碼主宰 - Grok 4 Code 變體在 SWE-Bench 上達到了 75%,在實際軟件工程任務中超越了其他所有模型。直接集成到開發環境中。

⚡ 多智能體智能 - Grok 4 Heavy 利用協作 AI 代理解決復雜問題,使準確性超越任何單一模型所能達到的水平。

🔮 實時知識 - 與靜態模型不同,Grok 4 訪問來自 X 的實時數據,提供當前的信息和上下文,而其他 AI 則無法匹配。

🚀 經濟天才 - 在商業模擬測試中超越了人類和所有 AI 模型,創造了比最近的競爭對手多 5 倍的收入。

🔧 API訪問 - 每百萬個令牌$3輸入 / $15輸出。反映高級能力的高級定價和用於處理大量文檔的256k令牌上下文窗口。

⚡ 標準Grok 4 - 通過X Premium+訂閱和Grok提供給希望獲得世界級AI而不需要企業價格的用戶。

💰 SuperGrok Heavy - 每月300美元,提前訪問Grok 4 Heavy及其前沿功能。市場上最貴的AI訂閱,但你爲SOTA性能付費。

#aitools grok4 #artificialintelligence xAI #elonmusk machinelearning #technology LLM #technews
GROK-3.98%
JST4.33%
EVERY8.97%
XAI1.27%
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)