根據 Beating,Microsoft 最近開源了 Phi-Ground 模型家族,該家族旨在解決「AI 應該在電腦螢幕的哪裡點擊」這個問題。這個 40 億參數版本,並搭配用於指令規劃的大型語言模型,在 Showdown 基準測試中超越了 OpenAI Operator 與 Claude Computer Use 的點擊精度,並在包含 ScreenSpot-Pro 的五項評估中,於所有低於 100 億參數的模型中排名第一。
團隊以超過 4,000 萬筆資料樣本進行訓練,並發現學術論文中常用的三種訓練技術在規模化後變得無效。關鍵方法證實其實很簡單:輸出座標作為一般數字,例如「523, 417」。先前的研究為座標發明了專用位置詞彙,但這些方法無法擴展到更大規模。團隊也發現,將文字指令放在影像之前能提升效能,因為模型在處理像素時就能辨識目標。此外,像 DPO 這類強化學習方法,即使在微調之後也能提升準確度。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Quantra 與 FishWar 宣布策略合作夥伴關係,將於 5 月 9 日整合 AI 遊戲與 RWA 基礎設施
根據 5 月 9 日的官方公告,Quantra 和 FishWar 宣布了一項策略合作,旨在結合由 AI 驅動的遊戲體驗與真實世界資產區塊鏈基礎設施。該合作已透過兩家公司官方社群媒體管道共同發布,目標是將 Quantra 的 RWA(真實世界資產)代幣化解決方案與 FishWar 的 GameFi 平台整合至 Sei Network。此項合作希望在解決 Web3 遊戲生態系中的技術挑戰(包含透明度與營運效率)的同時,強化區塊鏈遊戲的可擴充性、鏈上互動以及數位資產整合。
GateNews5分鐘前
山姆・艾爾曼揭露 ChatGPT 使用量按年齡分布,5 月 10 日時,18-24 歲中超過三分之一的人每天都在使用
根據《財富》(Fortune),OpenAI 執行長 Sam Altman 於 5 月 10 日透露,ChatGPT 使用者在不同年齡層之間有著不同的使用模式。年長使用者將該平台視為 Google 搜尋的替代品,而 20 多歲與 30 多歲的人則將其當作個人顧問。大學生將其用作每日作業系統,借助對話記憶來尋求情緒建議、職涯談判、醫療諮詢,以及重大人生決定。超過三分之一的美國 18 至 24 歲人士會頻繁使用 ChatGPT。
GateNews45分鐘前
香港財政司司長陳茂波強調大灣區的三大核心優勢:AI、製造業、金融
根據 ChainCatcher,香港財政司司長陳茂波近日發布了一份書面聲明,概述大灣區的三項核心優勢:先進的 AI 研究、完整的高端製造產業鏈,以及國際金融樞紐。陳茂波表示,這種「AI + 製造 + 金融」的組合,使香港能在第十五個五年計劃期間承擔兩項關鍵功能:產業協同與監管銜接,包括作為新興產業的「國際接口」,以及在國家與國際標準之間充當「交換與轉換的平台」。
GateNews1小時前
Anthropic Code Mode 解 MCP Vs CLI 之爭:工具住 Runtime、tokens 從 150K 壓到 2K
本文梳理 2025 年 MCP 與 CLI 的爭論,引用 Anthropic 的 Code Mode:改變工具呼叫的角色定位,讓模型寫程式碼並由 runtime 呼叫工具,工具細節在 runtime,型別與 API 透過 import 自動對齊。這樣把 token 從 150K 壓到約 2K,顯著提升效能與可擴展性;雖然 MCP 並未死,核心教訓是避免在 session context 一次性載入所有工具,讓 runtime 處理細節。
鏈新聞abmedia4小時前
字節跳動計劃今年在 AI 基礎設施支出上增加 25%,達 2000 億人民幣
根據 ChainCatcher 引述 Golden Data 的說法,字節跳動計劃在今年將 AI 基礎設施支出提高 25%,至 2000 億人民幣,推動因素包括記憶體晶片成本上升以及人工智慧發展加速。
GateNews4小時前
企業級 AI 平台 Pit 關閉 $16M 期融資,由 a16z 領投
根據 Odaily,企業級 AI 平台 Pit 宣布完成一輪 1,600 萬美元的融資,由 a16z 領投,Lakestar 參與,並有來自 OpenAI、Anthropic、Google、Deel 和 Revolut 的高管加入。Pit 將自己定位為「AI 產品團隊作為服務」(AI product team as a service),旨在取代傳統試算表以及僵化的 SaaS 系統。
GateNews4小時前