北京大学申请大语言模型软硬件协同量化加速计算方法及系统专利,实现硬件高效的推理计算

金融界 2024-02-22 12:42:18

金融界2024年2月21日消息,据国家知识产权局公告,北京大学申请一项名为“一种大语言模型软硬件协同量化加速计算方法及系统“,公开号CN117574976A,申请日期为2024年1月。

专利摘要显示,本发明公布了一种大语言模型软硬件协同量化加速计算方法及系统,采用以通道为粒度处理大语言模型中的离群值,将存在大量离群值的通道整体以高精度进行存储,通过自适应量化过程、编译优化过程和硬件实现过程,实现大语言模型软硬件协同推理加速,保证了数据编码的灵活性和规整性,同时易于在系统和硬件上进行实现和部署;可重构加速器系统包括:运算模块、累加模块、解码模块、控制模块、片上缓存和主存。采用本发明,既能够有效保持量化后模型的精度,又能实现硬件高效的推理计算。

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎! 投诉
投资工具
精彩推荐
OpenAI扩大电商收入:开发ChatGPT结账系统,从产品销售抽成
凤凰网科技07-17 08:46:26
特斯拉Model Y L官宣后,李想、李斌等高管回应
凤凰网科技07-17 08:46:06
美证监会向贾跃亭发出提醒函,或因欺诈调查对其采取执法行动
凤凰网科技07-17 08:45:42
黄仁勋今日将与阿里云创始人王坚进行炉边谈话
金融界07-17 08:44:43
盘前公告淘金:六大行“集齐”AIC牌照;国资入主!山科智能今日复牌
金融界07-17 08:44:20
全部评论 0
没有评论,谈谈您的想法…
谈谈你的想法...
App内打开