SubQ 发布 1.1 版本,并由第三方验证显示在 1200 万代币下准确率达到 98%

根据 Beating 动察,SubQ 发布了其 1.1 Small 版本,并附带一份技术报告,声称在极端上下文长度为 1200 万 tokens 时,检索准确率达到 98%,并由第三方评估器 Appen 验证。该模型在实际编程测试中的表现与领先的前沿模型相当。开发公司 Subquadratic 披露,该模型并非从零开始训练,而是通过对开源前沿模型的注意力机制进行修改构建,并在 1 万亿 tokens 上进行增量训练。

尽管第三方完成了验证,开发者社区仍然持怀疑态度。研究人员指出,所称突破缺乏基础性的技术新意,只是应用了既有的稀疏注意力机制。部分人指出技术报告中存在由 AI 生成的填充文本,而另一些人则警告,过滤机制可能会在并发使用时引入调度开销,进而在边缘场景中造成严重的延迟。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论