华为开源AI推理加速关键技术 助力缓解HBM依赖
(图片来自网络)
近日,华为宣布开源AI推理加速关键技术——UCM(Unified Cache Manager)推理记忆数据管理,为缓解高带宽内存(HBM)价格暴涨和出口管制带来的依赖问题提供新方案。
UCM技术的核心是分级缓存数据,根据记忆热度在不同存储介质(如HBM、DRAM、SSD)管理数据,优化推理效率、减少重复运算,提高HBM利用率与成本平衡。华为UCM架构包含多个功能模块,具备稀疏注意力、前缀缓存等四大关键能力,可降低首Token时延、提升系统吞吐。
- HBM存储“实时记忆数据”、DRAM存“短期记忆数据”、SSD存“长期记忆数据与外部知识”,实现分级管理推理产生的KV Cache记忆数据。
- UCM的四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦,可实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展。
华为还推出多款高性能AI SSD(如Huawei OceanDisk系列),配合UCM技术优化AI训练与推理体验。“AI SSD聚焦提升训练效率和推理体验,存储领域不会仅有HBM一枝独秀,有望形成百花齐放的竞争态势。”知情人士表示,华为计划与一体机厂商合作,改变现有局面。
当前,国外厂商(SK海力士、美光科技、三星电子)在HBM领域仍占主导,SK海力士HBM4明年供应单价约560美元(约合人民币3991元),带宽目标超2 TB/s。但出口管制导致中国企业难以获得充足高端HBM,UCM开源的意义在于让更多开发者和企业通过记忆数据分级管理,降低对高端HBM的依赖。需注意UCM并非取代HBM,而是通过分级管理发挥HBM优势、实现降本增效。
此外,华为自研的HiBL 1.0、HiZQ 2.0两款HBM,与Ascend 950 Die合封后形成Ascend 950PR、Ascend 950DT芯片,针对不同AI场景提供自研存储选择,进一步推动AI存储技术自主化发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月6日:华为Mate 70 Air新品引发网友讨论:这‘Air’到底啥样?
- 2025年11月6日:深蓝L06轿车预售,瞄准15万级市场(重振轿车产品线)
- 2025年11月6日:车企为何总做“期货”?
- 2025年11月6日:内存涨价与AI影响:消费者购买手机/电脑更难‘省’
- 2025年11月6日:全运会跳水女子双人十米台赛 陈芋汐/掌敏洁夺冠 全红婵组合获第5
- 2025年11月6日:巴黎圣日耳曼后卫阿什拉夫暂缓手术 望备战非洲杯揭幕战
- 2025年11月6日:德约科维奇第199次杀入巡回赛男单四强 创单打比赛纪录
- 2025年11月6日:哈曼点评拜仁欧冠竞争力:巴黎胜利成警告 拜仁仍为夺冠强竞争者
- 2025年11月6日:WTA年终总决赛四强对阵公布:萨巴伦卡等球员晋级四强
- 2025年11月6日:微软前工程师给40年前电脑装90公斤古董硬盘 创时代错位复古项目
- 2025年11月6日:谷歌推出新一代AI芯片Ironwood,科技巨头股价受影响
- 2025年11月6日:5G - A智能机器人革新电网巡检与全运场景,前沿科技赋能安全与赛事
- 2025年11月6日:2026 Swift学生挑战赛2月开赛,杰出者获免费参观苹果总部机会
- 2025年11月6日:FIFA公布2025年度最佳门将候选名单 8大热门门将名单揭晓
- 2025年11月6日:FIFA公布年度最佳男足教练候选名单 恩里克、斯洛特、弗里克等教练在列
- 2025年11月6日:小鹏科技日多领域技术突破,车企拓展AI边界
- 2025年11月6日:苹果研发第二代iPhone Air 或搭载双后置摄像头
- 2025年11月6日:利物浦传奇队明年将迎多特蒙德传奇队踢慈善赛,安菲尔德球场成焦点
- 2025年11月6日:斯帕莱蒂考虑戴维都灵德比首发 尤文备战意甲关键对决
- 2025年11月6日:C罗谈世界杯立场:不将世界杯当梦想 7场论历史最佳存争议

精彩评论(10)