DeepSeek 和北京大学于 6 月 27 日发布 DSpark 论文,创始人梁文峰列为作者

据 Guru Club,6 月 27 日,DeepSeek 团队与北京大学联合发布研究论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。该论文引入推测解码模块,以优化现有模型 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 的推理性能。同时,团队在 MIT 许可下开源了 DeepSpec,这是一个用于训练和评估推测解码草稿模型的全栈代码库。DeepSpec 目前支持三种实现:DSpark、DFlash 和 Eagle3。值得注意的是,DeepSeek 创始人梁文峰被列为论文作者。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
ManeyToFuturevip
· 1小时前
冲啊 🔥
查看原文回复0