英伟达推出首款专为大规模上下文AI设计的CUDA GPU Rubin CPX

(图片来自网络)
英伟达今日正式推出新产品 Rubin CPX,这是全球首款专为大规模上下文AI设计的高性能CUDA GPU,专为满足大规模上下文处理需求(如大规模编码、生成视频等高要求工作)而打造。
从技术设计来看,Rubin CPX在处理逻辑上更清晰,将理解AI提示任务与生成响应任务有效区分,以此提升整体效率。据英伟达披露,该GPU预计将作为Vera Rubin平台一部分使用,该平台整合了Vera CPU与Rubin GPU,协同工作。
在性能方面,英伟达声称全机架版本Vera Rubin NVL144 CPX具备8 exaflops的AI性能,且独立的Rubin CPX GPU搭载128GB GDDR7显存。此外,该硬件还具备3倍attention能力,并使用公司的4-bit NVFP4精度提供30 petaflops的计算能力。
英伟达CEO黄仁勋对该产品评价称:“如同RTX革新了图形和物理AI领域,Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”同时,他提到,部署该硬件的1亿美元投资有望产生50亿美元收益,体现其商业化潜力。
在软件支持层面,Rubin CPX将得到英伟达完整软件栈的支撑,包含Nemotron系列多模态模型,该模型提供从Nano到Ultra的不同尺寸选择,适配设备端应用、单GPU设置到大型数据中心等不同场景。
预计Rubin CPX将于2026年底推出市场,为AI领域大规模数据处理带来新的技术突破。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月16日:8点1氪|多社会热点事件:西贝致歉、罗永浩停战等汇总
- 2025年9月16日:Meta携手雷朋推智能眼镜:单眼HUD+手势手环曝光
- 2025年9月16日:苹果发布HomePod 26更新,新增Apple Music淡入渐出等功能
- 2025年9月16日:阿里推出新语音识别模型,幻觉率下降近70%
- 2025年9月16日:一笔破纪录投资背后:大湾区‘光芯走廊’上的佛山
- 2025年9月16日:反倾销“双响炮”:中国打响模拟芯片保卫战
- 2025年9月16日:小米17相关传闻被证实为谣言
- 2025年9月16日:苹果公开解释iOS更新后iPhone掉电、发热等影响
- 2025年9月16日:预算限制+战略变革,大众电动高尔夫上市计划或延迟9个月
- 2025年9月16日:苹果在全球市场拓展Apple Music音乐转移工具 支持多平台音乐迁移
- 2025年9月16日:勒沃库森球员帕拉西奥斯手术顺利完成 专注康复重返赛场
- 2025年9月16日:阿森纳门将拉亚谈欧冠:球队成长 预期新赛季更高表现
- 2025年9月16日:斯科尔斯解析曼市德比失利:阿莫林主帅战术体系易被破解
- 2025年9月16日:斯科尔斯谈门将转会:后悔未签多纳鲁马 纪念舒梅切尔
- 2025年9月16日:足球明星帕尔特伊面临出庭与比赛冲突
- 2025年9月16日:OpenAI发布GPT-5-Codex: 编程新工具支持长时间独立工作
- 2025年9月15日:中国将依法依规开展TikTok技术出口审批
- 2025年9月15日:【钛晨报】多领域动态汇总:车企规范供应商账款、英伟达反垄断、美联储降息等
- 2025年9月15日:谷歌成美股第四家3万亿市值公司 黄金期货再创新高
- 2025年9月15日:谷歌母公司市值突破3万亿美元 创新里程碑
精彩评论(10)