英伟达发布超长上下文推理芯片Rubin CPX 助力AI算力效率升级

(图片来自网络)
财联社9月10日讯(编辑 史正丞)全球人工智能算力芯片龙头英伟达宣布推出专为长上下文工作负载设计的专用GPU Rubin CPX,旨在翻倍提升当前AI推理运算的工作效率,尤其适用于编程、视频生成等需超长上下文窗口的应用。
英伟达CEO黄仁勋表示,Rubin CPX是首款专为需一次性处理大量知识(数百万级别tokens)并进行人工智能推理的模型而构建的芯片。需注意Rubin是英伟达明年发售的下一代顶级算力芯片,基于Rubin的CPX预计2026年底出货。
下一代英伟达旗舰AI服务器全称NVIDIA Vera Rubin NVL144 CPX,集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。搭载Rubin CPX的机架在处理大上下文窗口时,性能比当前旗舰机架GB300 NVL72高出最多6.5倍。下一代机架将提供8 exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍,单个机架提供100 TB高速内存和1.7 PB/s内存带宽。
英伟达通过分拆推理计算负载为上下文阶段与生成阶段,针对性优化计算与内存资源,显著提升算力利用率。Rubin CPX针对“数百万tokens”级别的长上下文性能优化,具备30 petaFLOPs算力与128GB GDDR7内存。预计约20%的AI应用会受益,如解码10万行代码更高效、视频处理延迟降低等。
英伟达计划以两种形式提供Rubin CPX:与Vera Rubin同托盘安装,或单独出售对应机架的CPX芯片,匹配Rubin机架配置。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月15日:意甲球员帕斯远射进球数据亮眼,五大联赛远射榜仅次于亚马尔
- 2025年9月15日:热刺主帅弗兰克首战欧冠:大事与逐场应对
- 2025年9月15日:阿尔特塔谈欧冠:失败次数远多于成功 赛前备战应对挑战
- 2025年9月15日:吉达国民4-2逆转纳萨夫 米约梅开二度助球队获胜
- 2025年9月15日:里斯-詹姆斯:欧冠队长之梦与夺冠渴望
- 2025年9月15日:人工智能治理2.0发布 电商平台加码补贴后黄牛遇冷
- 2025年9月15日:马竞前锋阿尔瓦雷斯因膝伤缺席与利物浦的比赛对决
- 2025年9月15日:意甲升班马克雷莫内塞成首支前3轮不败球队,刷新2012-13赛季纪录
- 2025年9月15日:图多尔谈欧冠备战:意甲战术更复杂 偏爱4-3胜过1-0
- 2025年9月15日:阿尔特塔:欧冠夺冠常需多次尝试 阵容健康是关键
- 2025年9月15日:拉亚出席阿森纳赛前发布会 谈竞争与凯帕合作
- 2025年9月15日:巴萨欧冠迎新球衣 逐绿后首穿橙色客场出战
- 2025年9月15日:意甲联赛第3轮 维罗纳主场0-0战平克雷莫内塞
- 2025年9月15日:皇马锋线新星恩德里克有望本月底复出客战凯拉特
- 2025年9月15日:本菲卡主席候选表示曼市德比后未会面B席和阿莫林
- 2025年9月15日:格雷罗确定缺席欧冠与德甲比赛 拜仁官方确认伤情
- 2025年9月15日:华为联合多方发布大容量SSD标准 首次定义关键指标
- 2025年9月15日:金山办公与华为联合打造AI协同办公“直升机” 助力中国企业数智化与全球化转型
- 2025年9月15日:苹果iOS 26正式版发布:液态玻璃新设计、AI功能升级
- 2025年9月15日:苹果 macOS 26 Tahoe 正式版推送,Mac用户可升级体验新功能
精彩评论(10)