北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%

格隆汇 2026-06-27 17:50:16
10秒看完全文要点
看要点

DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。

财经频道更多独家策划、专家专栏,免费查阅>>

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎!
全部评论
谈谈您的想法...
AI解读分析
打开App
推荐 要闻 7x24 理财 财 经 导航