曦望发布新一代推理GPU芯片S3 2025交付破万片 推动‘百万Token一分钱’落地
(图片来自网络)
1月27日,国产GPU厂商曦望(Sunrise)召开首届Sunrise GPU Summit,正式发布新一代推理GPU芯片启望S3,并公布围绕推理场景的算力产品与生态计划。这是曦望近一年完成约30亿元战略融资后首次集中公开亮相。
芯片核心特性:启望S3是面向大模型推理深度定制的GPGPU芯片。在架构与存储设计上,支持从FP16到FP4的精度切换,采用了LPDDR6显存方案,显存容量较上一代提升4倍,有效缓解大模型推理中的显存瓶颈问题。官方数据显示,在主流大模型推理场景下,S3的单位Token推理成本较上一代降低约90%,为“百万Token一分钱”的工程化落地筑牢基础。此外,其基础软件体系已覆盖ModelScope平台90%以上的主流大模型,兼容性得到强化。
系统级解决方案:曦望同步推出面向大模型推理的寰望SC3-256超节点方案。该方案采用全液冷设计,支持大规模专家并行(EP)部署,在同等算力规模下,整体交付成本控制在千万元级别,相较行业内同类方案有明显下降,为算力基础设施化提供支撑。
推理云共建计划:以启望S3为技术底座,曦望启动推理云共建计划,通过MaaS(模型即服务)模式向企业企业提供标准化推理服务,降低企业底层运维门槛。目前,曦望已联合商汤科技、第四范式等生态伙伴共同推动该计划落地,同时与浙江大学等高校及中交信科、杭钢数字科技等多家企业达成战略合作,成立“智能计算联合研发中心”。
曦望董事长徐冰表示,2025年启望S3芯片交付量已突破万片,未来将继续围绕“芯片+系统+生态”布局,推动推理算力基础设施化发展。
(来源:网易科技报道)
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行
- 2026年1月28日:春晚未启,AI先战!字节、腾讯、百度大厂抢位AI超级入口
- 2026年1月28日:谷歌云上调部分数据传输服务价格 北美地区价格翻倍
- 2026年1月28日:苹果计划维持iPhone 18起售价 面对内存成本上涨
- 2026年1月28日:中国科学家研发‘智能电子衣’ 实现器官精准可控给药
- 2026年1月28日:中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?
- 2026年1月28日:泰国U23国脚提拉帕租借加盟J联赛札幌队 比肩中国赛展现才华
- 2026年1月28日:德约科维奇赢9盘进澳网四强?对比2016年美网仅赢8盘,是大满贯最幸运之旅吗?
- 2026年1月28日:蚂蚁GPASS技术与小米智能眼镜合作 推出停车缴费、AI健康等智能服务

精彩评论(10)