华为云CEO张平安:CloudMatrix384 AI Token服务全面上线,昇腾AI云服务创新升级

2025年9月19日
news

(图片来自网络)

在华为全联接大会2025(HC 2025)上,华为云计算CEO张平安带来了昇腾AI云服务的重磅升级与创新。他介绍,依托华为最新AI服务器规划,华为云CloudMatrix云上超节点规格将从384卡升级至未来8192卡,打造50~100万卡的超大集群,为智能时代提供更澎湃的AI算力。

为释放算力潜能,华为云首创弹性内存存储服务(EMS),打破传统AI算力与显存绑定限制,以内存替代昂贵的显存“以存补算”,大幅提升大模型多轮对话性能。

面对指数级增长的AI算力需求,华为云推出灵活的AI Token服务。张平安指出,Token服务可有效屏蔽复杂技术实现,是高效使用推理算力的方式。会上,华为云CloudMatrix 384 AI Token服务全面上线,以优质性能、良好服务、高质量保障,高效满足各行业“最终AI计算结果”需求。

华为云通过CloudMatrix 384超节点的创新架构,将资源全面池化,形成算力池、内存池、显存池等,将计算、存储、AI专家系统解耦,将串行任务转为分布式并行任务,大幅提升系统推理性能。在在线、近线、离线不同时延场景下,CloudMatrix 384平均单卡推理性能是中国特供H20的3~4倍。

  • 为Pangu、DeepSeek、Qwen等主流大模型提供极致Token服务,加速各行业AI技术落地与业务创新。
  • 360纳米AI依托该服务处理每天上千万内容生成请求。
  • 中科院“磐石·科学基础大模型”平台基于超节点架构及融合算子优化,模型训练精度更高,支持100+专业院所领域场景。

此外,华为云在贵州、内蒙古、安徽部署大规模全液冷AI数据中心,将液冷年均PUE降低至1.1,提升散热、功耗、运维效率。企业可通过华为云全栈专属AI云服务,将模型和数据放在专属物理隔离资源池训练调优,端到端加密且自主掌握密钥,保障数据安全与效率。

昇腾AI云服务的升级,不仅带来极致性能的Token服务,更通过技术创新与多样化部署,为千行万业智能化升级注入动力,推动AI技术深度应用,目前客户数量从去年321家增长至今年1805家,AI总算力规模同比增长268%。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-19 12
    幽默的人说,华为云算力升级像“顿了顿咖啡”,更精神了!
  • 网友9 2025-09-19 12
    理性的职场人说,算力升级能提升企业效率,全栈服务保障安全很实用。
  • 网友8 2025-09-19 12
    活泼的年轻人说,CloudMatrix384 AI Token太厉害了,感觉未来更智能。
  • 网友7 2025-09-19 12
    温和的中年人说,华为云服务很贴心,全液冷数据中心解决散热问题,挺好。
  • 网友6 2025-09-19 12
    研究生觉得昇腾架构优化提升效率,技术领先很满意。
  • 网友5 2025-09-19 12
    大学生觉得算力升级对科研有帮助,期待更多应用场景。
  • 网友4 2025-09-19 12
    小学生觉得这个云服务能帮忙电脑更厉害,对科技很有兴趣。
  • 网友3 2025-09-19 12
    CloudMatrix384太酷了,感觉未来AI会更厉害,迫不及待想用!
  • 网友2 2025-09-19 12
    华为云的升级对企业和行业都有帮助,算力提升很重要,支持!
  • 网友1 2025-09-19 12
    这个科技太牛了,以后生活工作都方便很多,期待体验!
查看“华为云CEO张平安:CloudMatrix384 AI Token服务全面上线,昇腾AI云服务创新升级”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙