曦望发布新一代推理GPU芯片S3 2025交付破万片 推动‘百万Token一分钱’落地

2026年1月28日
news

(图片来自网络)

1月27日,国产GPU厂商曦望(Sunrise)召开首届Sunrise GPU Summit,正式发布新一代推理GPU芯片启望S3,并公布围绕推理场景的算力产品与生态计划。这是曦望近一年完成约30亿元战略融资后首次集中公开亮相。

芯片核心特性:启望S3是面向大模型推理深度定制的GPGPU芯片。在架构与存储设计上,支持从FP16到FP4的精度切换,采用了LPDDR6显存方案,显存容量较上一代提升4倍,有效缓解大模型推理中的显存瓶颈问题。官方数据显示,在主流大模型推理场景下,S3的单位Token推理成本较上一代降低约90%,为“百万Token一分钱”的工程化落地筑牢基础。此外,其基础软件体系已覆盖ModelScope平台90%以上的主流大模型,兼容性得到强化。

系统级解决方案:曦望同步推出面向大模型推理的寰望SC3-256超节点方案。该方案采用全液冷设计,支持大规模专家并行(EP)部署,在同等算力规模下,整体交付成本控制在千万元级别,相较行业内同类方案有明显下降,为算力基础设施化提供支撑。

推理云共建计划:以启望S3为技术底座,曦望启动推理云共建计划,通过MaaS(模型即服务)模式向企业企业提供标准化推理服务,降低企业底层运维门槛。目前,曦望已联合商汤科技、第四范式等生态伙伴共同推动该计划落地,同时与浙江大学等高校及中交信科、杭钢数字科技等多家企业达成战略合作,成立“智能计算联合研发中心”。

曦望董事长徐冰表示,2025年启望S3芯片交付量已突破万片,未来将继续围绕“芯片+系统+生态”布局,推动推理算力基础设施化发展。

(来源:网易科技报道)

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-28 16
    曦望这次发布的产品技术提升明显,推动‘百万Token一分钱’很务实。
  • 网友9 2026-01-28 16
    推理云计划和芯片发布后,未来算力服务模式可能变化,很感兴趣。
  • 网友8 2026-01-28 16
    启望S3在精度和显存优化上做得好,对大模型推理场景确实有帮助。
  • 网友7 2026-01-28 16
    科技让算力更普及,这个芯片落地后对产业有帮助,值得期待。
  • 网友6 2026-01-28 16
    曦望的系统方案和芯片结合得挺好,算力成本降下来后企业用着方便。
  • 网友5 2026-01-28 16
    推理GPU芯片我有点好奇,但看到它能降成本就觉得不错,很有用。
  • 网友4 2026-01-28 16
    S3芯片像给大模型推理打了折扣,百万Token一分钱的目标挺有希望的。
  • 网友3 2026-01-28 16
    现在的科技发展真快,芯片让大模型推理更轻松,进步很大!
  • 网友2 2026-01-28 16
    曦望在推理GPU芯片上的进展不错,成本和显存设计都有优势,值得关注。
  • 网友1 2026-01-28 16
    这个芯片能帮大模型推理更便宜,以后用起来太实惠了,很期待!
查看“曦望发布新一代推理GPU芯片S3 2025交付破万片 推动‘百万Token一分钱’落地”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙