人工分析(Artificial Analysis)今天發布一份新的「程式代理(Coding Agent)指標」,用以評估當 AI 模型與代理框架結合時在多項關鍵基準測試上的表現,包括 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 與 SWE-Atlas-QnA。在此次評估中,智譜 GLM-5.1 在開源模型中排名第一,展現出在真實世界的程式代理場景中的領先效能。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
TT Chain 於 5 月 11 日整合 AegisAI 安全系統以保護 RWA
根據 TT Chain 於 5 月 11 日的公告,第二層區塊鏈網路將 AegisAI 以 AI 為驅動的安全基礎設施整合至其真實世界資產生態系統。此合作透過先進威脅偵測與智慧合約稽核能力,強化代幣化資產交易與跨鏈作業的防護。 AegisAI 的自主 AI 代理能即時偵測釣魚攻擊、阻止未授權的存取嘗試,並辨識智慧合約中的弱點。TT Chain 表示,此次整合可強化代幣化真實世界資產管理的基礎設施可靠性,同時也能因應去中心化金融平台日益攀升的資安疑慮。
GateNews50分鐘前
京東升級自研 AI 代理程式,Q1 用戶成長超過 300%
根據 JD.com 執行長許冉於 5 月 12 日的財報電話會議上的說法,公司正在全面升級自研 AI 代理,以更精準地辨識、啟用並匹配使用者需求。JD.com 的 AI 助理「Jingdong Jingyan」在第一季度的使用者使用量年增超過 300%。
GateNews1小時前
The Graph 在 5 月 12 日推出 x402 付款功能,支援每筆請求的鏈上資料存取(USDC)
根據 The Graph 於 5 月 12 日的官方公告,Graph Gateway 現在支援 x402 Payments,讓開發者與 AI Agents 能以每次請求使用 USDC 的方式存取鏈上資料,而不需 API keys、帳號或儀表板。使用者會收到包含價格資訊的 HTTP 402 回應,接著在 Base 網路上以基於簽章的方式用 USDC 完成付款,以在後續請求中取得資料。此更新包含新的 /api/x402/ 端點、更新後的付款 SDK、支援 x402 相容工具,以及同時在 Base 主網與 Base Sepolia 測試網上提供;同時,既有的 API Key 驗證方式保持不變。
GateNews1小時前
SAP 投資 n8n,使工作流程自動化平台的估值翻倍至 52 億美元
根據 Bloomberg 報導,SAP 於週二投資 n8n,使這款工作流程自動化平台的估值翻倍至 52 億美元。SAP 在聲明中表示,這家德國軟體巨頭也與 n8n 簽署了一份為期多年的夥伴協議,將該平台的工具整合進 SAP 的 Joule Studio AI 代理建置平台。
GateNews2小時前
DAPPOS 推出 xBubble,具備 10+ 項核心功能的通用 AI 代理,面向非技術使用者
根據 ChainCatcher,DAPPOS 已正式推出 xBubble,這是一款面向非技術使用者的通用 AI 智能體產品。該產品會自動推薦專業智能體,以使用最少的提示詞完成任務,並降低除錯迭代次數。xBubble 提供 10+ 項核心能力,涵蓋影像、影片、文件與網站建立,支援本地與雲端部署。
GateNews7小時前
Nous Research 推出 Hermes Agent,進行 macOS 電腦控制,可將代幣消耗降低 95%
Nous Research 宣布其 Hermes Agent 已推出 macOS 電腦控制功能,據 Beating 的監測。該功能可在不干擾使用者輸入或視窗焦點的情況下進行背景操作,例如電子郵件搜尋與程式碼撰寫。透過四層情境壓縮機制,該框架在以 1568×900 解析度連續執行 20 次操作時,將代幣消耗從約 600,000 降至 30,000 tokens。
GateNews9小時前