据 Beating 称,微软最近开源了 Phi-Ground 模型家族,旨在解决“AI 应该在计算机屏幕上点击哪里”的问题。该 40 亿参数版本,并结合用于指令规划的更大语言模型,在 Showdown 基准测试中超过了 OpenAI Operator 和 Claude Computer Use 的点击准确率,并在包括 ScreenSpot-Pro 在内的五项评估中位列所有 100 亿以下参数模型的第一名。
团队在超过 4000 万个数据样本上进行了训练,并发现学术论文中使用的三种常见训练技术在规模化时变得无效。关键思路证明很简单:以常规数字输出坐标,例如“523, 417.” 先前的研究为坐标发明了专门的位置词汇,但这些方法无法规模化。团队还发现,将文本指令放在图像之前可以提升性能,因为模型在处理像素时能够识别目标。此外,诸如 DPO 之类的强化学习方法在微调之后仍能提高准确率。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Quantra 和 FishWar 宣布战略合作伙伴关系,以在 5 月 9 日将 AI 游戏与 RWA 基础设施整合
根据 5 月 9 日的官方公告,Quantra 和 FishWar 宣布建立战略合作伙伴关系,旨在将由 AI 驱动的游戏体验与现实世界资产区块链基础设施相结合。该合作通过两家公司官方社交媒体渠道共同发布,目标是在 Sei Network 上将 Quantra 的 RWA 代币化解决方案与 FishWar 的 GameFi 平台进行整合。该合作旨在增强区块链游戏的可扩展性、链上互动以及数字资产整合,同时解决 Web3 游戏生态系统中的技术挑战,包括透明度和运营效率。
GateNews6 分钟前
萨姆·奥特曼披露了按年龄划分的 ChatGPT 使用情况:到 5 月 10 日,18-24 岁人群中每日使用者占比超过三分之一
据《财富》报道,OpenAI 首席执行官山姆·奥特曼在 5 月 10 日透露,ChatGPT 用户在不同年龄群体中的使用模式各不相同。年长用户将该平台视为谷歌搜索的替代品,而 20 多岁和 30 多岁的人则将其用作个人顾问。大学生将其作为日常操作系统使用,借助对话记忆来获取情感建议、职业谈判、医疗咨询以及重大人生决策。超过三分之一的美国 18 至 24 岁人群经常使用 ChatGPT。
GateNews46 分钟前
香港财政司司长陈茂波强调大湾区的三大核心优势:AI、制造业、金融
据 ChainCatcher 报道,香港财政司司长陈茂波近日发布书面声明,概述大湾区的三大核心优势:前沿 AI 研究、完善的高端制造产业链以及国际金融枢纽。陈茂波表示,这种“AI + 制造业 + 金融”的组合使香港能够在第十五个五年计划期间发挥两项关键职能:产业协调与监管衔接,包括充当新兴产业的“国际接口”,以及国家标准与国际标准之间的“交流与转化平台”。
GateNews1小时前
Anthropic Code Mode:解 MCP Vs CLI 之争:工具住 Runtime、tokens 从 150K 压到 2K
2025 年整年 AI 工程社群在「MCP vs CLI」哪个更适合 Agent 工具呼叫的问題上爭論不休、Anthropic 2025 年 11 月发表的「Code execution with MCP」论文从第一原則重新定義了问題。akshay\pachaar 5/10 整理 thread 说明:问題从来不在協议本身、而在「session 开始时把所有工具描述塞进 context」的旧习惯;Anthropic 的解法是让模型寫程式码呼叫工具、运行时负责管理工具細节。新模式被称为「Code Mode」。 旧模式的问題:150K tokens 中模型大部分用不到 旧 MCP 模式的浪费结构: Playwright MCP:13.7K tokens(一次塞滿) Chrome DevTools MCP:18K tokens 5 个 server 设定:尚未开始工作就燒掉 55K tokens 單一 workflow 完整执行:可膨胀到 150K tokens 模型实际用到的:絕大部分都用不上 批評者主張改用 CLI、但 CLI 在多租户 app 容易出错、缺乏 typed contract
鏈新聞abmedia4小时前
字节跳动计划今年在 AI 基础设施支出上增加 25%,达到 2000 亿人民币
据 ChainCatcher 援引 Golden Data 称,字节跳动计划今年将 AI 基础设施支出提高 25%,达到 2000 亿人民币,原因是内存芯片成本上升以及人工智能开发加速。
GateNews4小时前
企业 AI 平台 Pit 关闭 $16M 系列融资,由 a16z 领投
据 Odaily,企业级 AI 平台 Pit 宣布完成一轮由 a16z 牵头的 1600 万美元融资,Lakestar 参与其中,OpenAI、Anthropic、Google、Deel 和 Revolut 的高管也加入了本轮。Pit 将自己定位为“AI 产品团队即服务”,旨在取代传统电子表格和僵化的 SaaS 系统。
GateNews4小时前