华为开源AI推理加速关键技术 助力缓解HBM依赖
(图片来自网络)
近日,华为宣布开源AI推理加速关键技术——UCM(Unified Cache Manager)推理记忆数据管理,为缓解高带宽内存(HBM)价格暴涨和出口管制带来的依赖问题提供新方案。
UCM技术的核心是分级缓存数据,根据记忆热度在不同存储介质(如HBM、DRAM、SSD)管理数据,优化推理效率、减少重复运算,提高HBM利用率与成本平衡。华为UCM架构包含多个功能模块,具备稀疏注意力、前缀缓存等四大关键能力,可降低首Token时延、提升系统吞吐。
- HBM存储“实时记忆数据”、DRAM存“短期记忆数据”、SSD存“长期记忆数据与外部知识”,实现分级管理推理产生的KV Cache记忆数据。
- UCM的四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦,可实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展。
华为还推出多款高性能AI SSD(如Huawei OceanDisk系列),配合UCM技术优化AI训练与推理体验。“AI SSD聚焦提升训练效率和推理体验,存储领域不会仅有HBM一枝独秀,有望形成百花齐放的竞争态势。”知情人士表示,华为计划与一体机厂商合作,改变现有局面。
当前,国外厂商(SK海力士、美光科技、三星电子)在HBM领域仍占主导,SK海力士HBM4明年供应单价约560美元(约合人民币3991元),带宽目标超2 TB/s。但出口管制导致中国企业难以获得充足高端HBM,UCM开源的意义在于让更多开发者和企业通过记忆数据分级管理,降低对高端HBM的依赖。需注意UCM并非取代HBM,而是通过分级管理发挥HBM优势、实现降本增效。
此外,华为自研的HiBL 1.0、HiZQ 2.0两款HBM,与Ascend 950 Die合封后形成Ascend 950PR、Ascend 950DT芯片,针对不同AI场景提供自研存储选择,进一步推动AI存储技术自主化发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月6日:超惊艳!全球共赏2025年度最大超级月亮
- 2025年11月6日:ICML 2026学术会议征稿出台新规定:参会可选、原稿公开、互审设限额
- 2025年11月6日:快讯:智象未来‘灵感智能体’斩获ACM国际多媒体会议最佳演示奖,成国内多模态AI第一获奖团
- 2025年11月6日:科技领域多元热点事件:山姆App更新遭用户吐槽、Nintendo Switch2销量破千万、小米预警存储涨价等|极客早知道
- 2025年11月6日:华为FreeBuds Pro 5多配色耳机即将发布
- 2025年11月6日:开拓者逆转战胜雷霆终结8连胜 阿夫迪亚26+10贡献关键数据
- 2025年11月6日:苹果公开8K沉浸式视频制作流程,推动Vision Pro内容生态发展
- 2025年11月6日:一镜瞰乌镇:千年古镇与互联网科技共绘峰会新篇
- 2025年11月6日:长三角‘圈’出加速度:一体化发展破局产业新活力
- 2025年11月6日:我国航天器首次观测到星际天体!天问一号传回新照片
- 2025年11月6日:第十五届全国运动会倒计时3天,我们准备好了:粤港澳联合办赛成果斐然
- 2025年11月6日:前三季度我国机器人产量超去年全年 产业增长与技术突破并存
- 2025年11月6日:第十五届全国运动会主新闻中心准备就绪 召开首场新闻发布会
- 2025年11月6日:‘存力中国行’探讨AI推理挑战 华为开源UCM技术为破局关键
- 2025年11月6日:师生AI军备竞赛:教与学在智能时代的攻防博弈
- 2025年11月6日:华为Mate 70 Air命名规则及配置详情公布,新机预售信息同步公开
- 2025年11月6日:Nature重磅研究推出全球首个合规计算机视觉数据集:FHIBE推动AI公平性新标准
- 2025年11月6日:外骨骼助力行走、智能手环帮忙减重……多款科技性与互动性创新成果亮相进博会
- 2025年11月6日:欧冠奇迹!3.7万人口小城球队斩获首胜,队史与奖金双突破
- 2025年11月6日:欧冠4轮赛事:英超球队大爆发 双杀西甲后5队进欧冠前10

精彩评论(10)