曦望发布推理GPU芯片S3 聚焦推理算力成本创新

2026年1月28日
news

(图片来自网络)

在国产GPU行业向“推理驱动”转型的关键节点,专注于推理GPU的曦望(Sunrise)于1月27日发布新一代推理GPU芯片启望S3,并完成近一年累计30亿元战略融资后首次集中公开亮相。这标志着曦望将战略重心锚定在推理算力这一更具长期确定性的赛道,推动算力从“拼参数”转向“算清账”。


启望S3是一款面向大模型推理深度定制的GPGPU芯片,围绕真实推理负载对芯片架构、存储与互联进行了系统级设计。与上一代产品相比,S3在典型推理场景下性价比提升超10倍,单位Token推理成本降低约90%。


技术亮点解析:


  • 支持从FP16到FP4精度自由切换,在保证模型效果下提升低精度推理效率;

  • 率先采用LPDDR6显存方案,显存容量较上一代提升4倍,缓解大模型推理显存瓶颈;

  • 适配主流大模型(如DeepSeek V3等),实现“百万Token一分钱”规模化部署能力。


除芯片外,曦望同步发布推理算力产品体系与共建推理云生态计划。推理云计划通过整合算力资源,重构算力交付模式,为企业提供标准化服务,联合生态伙伴发起“百万Token一分钱”推理成本计划,推动大模型推理从“技术可行”走向“经济可行”。


在产业协同方面,曦望与高校、企业达成战略合作,成立“智能计算联合研发中心”,聚焦前沿领域研究,推动推理算力在交通、制造等行业落地,构建“芯片+系统+生态”整体布局,助力AI应用规模化发展。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-28 12
    产业协同方面合作这么多企业,以后推理算力在各行业应用场景肯定增多。
  • 网友9 2026-01-28 12
    教育领域用大模型推理的话,成本降低后教学资源能更丰富了,很期待。
  • 网友8 2026-01-28 12
    曦望这个芯片发布像在招财,不过技术角度确实很厉害,聚焦成本优化。
  • 网友7 2026-01-28 12
    技术发展确实快,这样的创新让AI算力更落地,生态合作也很重要。
  • 网友6 2026-01-28 12
    从“拼参数”到“算清账”的变化,说明AI算力已经有了成熟的成本控制思路。
  • 网友5 2026-01-28 12
    对企业和开发者来说,算力成本降低后,开展大模型推理项目更有优势了。
  • 网友4 2026-01-28 12
    哇,芯片性能提升这么多,推理成本降得这么厉害,AI普及速度会快很多。
  • 网友3 2026-01-28 12
    作为普通用户,觉得以后用AI服务更没问题了,成本降低太好了。
  • 网友2 2026-01-28 12
    曦望这步棋走得很对,推理算力是AI发展的关键,成本优化很重要。
  • 网友1 2026-01-28 12
    这个推理芯片技术进步明显,以后AI应用成本会降,方便咱们使用。
查看“曦望发布推理GPU芯片S3 聚焦推理算力成本创新”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙