华为开源AI推理加速关键技术 助力缓解HBM依赖

2025年11月6日
news

(图片来自网络)

近日,华为宣布开源AI推理加速关键技术——UCM(Unified Cache Manager)推理记忆数据管理,为缓解高带宽内存(HBM)价格暴涨和出口管制带来的依赖问题提供新方案。


UCM技术的核心是分级缓存数据,根据记忆热度在不同存储介质(如HBM、DRAM、SSD)管理数据,优化推理效率、减少重复运算,提高HBM利用率与成本平衡。华为UCM架构包含多个功能模块,具备稀疏注意力、前缀缓存等四大关键能力,可降低首Token时延、提升系统吞吐。



  • HBM存储“实时记忆数据”、DRAM存“短期记忆数据”、SSD存“长期记忆数据与外部知识”,实现分级管理推理产生的KV Cache记忆数据。

  • UCM的四大关键能力:稀疏注意力、前缀缓存、预填充卸载、异构PD解耦,可实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展。


华为还推出多款高性能AI SSD(如Huawei OceanDisk系列),配合UCM技术优化AI训练与推理体验。“AI SSD聚焦提升训练效率和推理体验,存储领域不会仅有HBM一枝独秀,有望形成百花齐放的竞争态势。”知情人士表示,华为计划与一体机厂商合作,改变现有局面。


当前,国外厂商(SK海力士、美光科技、三星电子)在HBM领域仍占主导,SK海力士HBM4明年供应单价约560美元(约合人民币3991元),带宽目标超2 TB/s。但出口管制导致中国企业难以获得充足高端HBM,UCM开源的意义在于让更多开发者和企业通过记忆数据分级管理,降低对高端HBM的依赖。需注意UCM并非取代HBM,而是通过分级管理发挥HBM优势、实现降本增效。


此外,华为自研的HiBL 1.0、HiZQ 2.0两款HBM,与Ascend 950 Die合封后形成Ascend 950PR、Ascend 950DT芯片,针对不同AI场景提供自研存储选择,进一步推动AI存储技术自主化发展。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-11-06 11
    有华为技术开源,创业做AI的企业前景光明,成本压力小了!
  • 网友9 2025-11-06 11
    存储是AI瓶颈,这个技术能突破,行业格局可能变化了。
  • 网友8 2025-11-06 11
    推动产业技术自主化,对国家科技安全有积极意义,华为很给力。
  • 网友7 2025-11-06 11
    这是什么技术?对普通用户用AI软件有没有帮助呀,期待应用普及。
  • 网友6 2025-11-06 11
    给AI存储降“火药价”,以后用AI更划算,华为做得对!
  • 网友5 2025-11-06 11
    这个架构很先进,对AI推理的优化效果值得期待,技术生态值得关注。
  • 网友4 2025-11-06 11
    开源技术能降低成本,中小企业做AI项目压力减轻了,赞!
  • 网友3 2025-11-06 11
    UCM的技术设计很聪明,分级管理能优化效率,以后应用肯定不错。
  • 网友2 2025-11-06 11
    搞这个技术好,不用怕存储涨价,以后用AI更方便了。
  • 网友1 2025-11-06 11
    华为开源这个技术太棒了,以后能少依赖进口存储,对AI发展很有帮助!
查看“华为开源AI推理加速关键技术 助力缓解HBM依赖”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙