华为云Tokens服务接入384超节点,算力性能升级至2400TPS
(图片来自网络)
在第四届828 B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix 384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50ms TPOT的超高吞吐、低时延性能,超越行业现有水平。
过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半时间内增长超过300倍,反映了我国人工智能应用规模快速增长,也对算力基础设施提出了更高要求。
在以往按卡时计费的基础上,今年3月,华为云正式推出基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。此次接入CloudMatrix 384超节点后,通过384原生的xDeepServe框架,将吞吐量从年初的1920TPS提升至2400TPS,TPOT仅为50ms。
xDeepServe以Transformerless的极致分离架构为CloudMatrix 384超节点提供服务,把MoE大模型拆分为可独立伸缩的Attention、FFN、Expert三个微模块,相当于在384超节点上把“大模型”拆成“积木”,分派到不同的NPU上同步处理任务。之后,再用基于内存语义的微秒级XCCL通信库与FlowServe自研推理引擎,把它们重新拼成一个超高吞吐的LLM服务平台(即Tokens的“超高速流水线”),通过不断调优,最终实现了从非超节点单卡吞吐600tokens/s至超节点单卡吞吐2400tokens/s的提升。
目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen等多家主流大模型及versatile、Dify、扣子等主流Agent平台。在应用层面,华为云已与超过100家伙伴携手深入行业场景,共建丰富的Agent,在调研分析、内容创作、智慧办公、智能运维等领域解决产业难题,让企业更便捷地拥抱AI创新,加速智能化。
例如,基于MaaS平台推出的“今日人才数智员工”解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能实现与用户的智能交互和任务处理,显著提升服务效率与客户满意度;北京方寸无忧科技开发的无忧智慧公文解决方案则可以提升公文处理效能,实现政企办公智能化转型。业内人士表示,以Token为动力的智能社会已经到来,而华为云将以系统级创新能力和全新的Tokens服务构筑先进算力,助力各行各业加速落地AI。
最新新闻
- 2025年11月7日:维尼修斯情绪管理引主帅关注 洪都拉斯教练分享引导心得
- 2025年11月7日:萨巴伦卡三盘大战重返总决赛争冠战,冲击网坛高额奖金
- 2025年11月7日:10连胜!26岁美女逆转晋级WTA年终决赛,网球赛场再创佳绩
- 2025年11月7日:曼联盼姆伯莫踢完维拉赛后赴非洲杯参赛
- 2025年11月7日:杭州‘六小龙’乌镇峰会探讨:回望发展历程,共话AI技术挑战
- 2025年11月7日:F1巴西站冲刺排位赛:诺里斯夺杆位 汉密尔顿止步SQ2
- 2025年11月7日:瑞士国家队公布新一期大名单 阿坎吉等球员领衔
- 2025年11月7日:克罗地亚国家队新一期大名单公布:魔笛格瓦领衔,科瓦契奇因伤退出
- 2025年11月7日:大厂动态:事业部调整、供应链改革与AI应用解析
- 2025年11月7日:当AI开始‘思考’:杭州‘六小龙’眼中的科技未来
- 2025年11月7日:AI带货遇翻车现象,各方责任如何界定?
- 2025年11月7日:群核科技创始人黄晓煌:聚焦空间智能技术,探索AI与机器人领域发展
- 2025年11月7日:小红书获得支付牌照,加速商业闭环建设
- 2025年11月7日:自动驾驶企业竞争风波:小马与文远上市前争议再起
- 2025年11月7日:刘鹏担任山姆中国总裁引争议,山姆面临信任危机
- 2025年11月7日:英超第11轮赛前比分预测 多场比赛看点前瞻
- 2025年11月7日:库尼亚谈帮队友夺冠 并直言去安菲尔德赢愿“抽筋”
- 2025年11月7日:云达不莱梅vs沃尔夫斯堡 德甲联赛第10轮首发阵容公布
- 2025年11月7日:预售10.58万元Lafa 5,零跑汽车圆轿跑梦
- 2025年11月7日:阿森纳角球进球数领跑英超,近四赛季定位球表现惊艳

精彩评论(10)