曦望发布推理GPU芯片S3 聚焦推理算力成本创新
(图片来自网络)
在国产GPU行业向“推理驱动”转型的关键节点,专注于推理GPU的曦望(Sunrise)于1月27日发布新一代推理GPU芯片启望S3,并完成近一年累计30亿元战略融资后首次集中公开亮相。这标志着曦望将战略重心锚定在推理算力这一更具长期确定性的赛道,推动算力从“拼参数”转向“算清账”。
启望S3是一款面向大模型推理深度定制的GPGPU芯片,围绕真实推理负载对芯片架构、存储与互联进行了系统级设计。与上一代产品相比,S3在典型推理场景下性价比提升超10倍,单位Token推理成本降低约90%。
技术亮点解析:
- 支持从FP16到FP4精度自由切换,在保证模型效果下提升低精度推理效率;
- 率先采用LPDDR6显存方案,显存容量较上一代提升4倍,缓解大模型推理显存瓶颈;
- 适配主流大模型(如DeepSeek V3等),实现“百万Token一分钱”规模化部署能力。
除芯片外,曦望同步发布推理算力产品体系与共建推理云生态计划。推理云计划通过整合算力资源,重构算力交付模式,为企业提供标准化服务,联合生态伙伴发起“百万Token一分钱”推理成本计划,推动大模型推理从“技术可行”走向“经济可行”。
在产业协同方面,曦望与高校、企业达成战略合作,成立“智能计算联合研发中心”,聚焦前沿领域研究,推动推理算力在交通、制造等行业落地,构建“芯片+系统+生态”整体布局,助力AI应用规模化发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:傅利叶结合脑机接口与具身智能 推出具身智能康复港
- 2026年1月28日:阿里云双线作战:一边烧钱一边突围
- 2026年1月28日:傅利叶公布‘1+3+X’具身智能生态战略布局
- 2026年1月28日:Omdia预测 存储成本上涨或抑制2026年智能手机AMOLED需求
- 2026年1月28日:10天随手写的AI,竟在GitHub狂飙7万星!「它开口那一刻,我吓懵了」
- 2026年1月28日:五年后南京苏州杭州宁波合肥:谁冲刺两万亿元?谁成AI第一城?
- 2026年1月28日:蚂蚁灵波开源具身大模型LingBot-VLA,跨本体跨任务泛化能力创新高
- 2026年1月28日:美团杀入万亿汽车市场,以流量破局外卖增长瓶颈
- 2026年1月28日:ClawdBot引发全球安全危机:CEO集体预警勿安装
- 2026年1月28日:内存涨价翻倍,iPhone变贵?天风郭明錤解析苹果新策略:承担成本抢份额,用服务赚回来
- 2026年1月28日:莱巴金娜横扫斯瓦泰克!澳网3年后再进四强
- 2026年1月28日:CBA常规赛前瞻:许利民解读赵睿斯佩尔曼复出,聚焦天津比赛
- 2026年1月28日:杨瀚森6中2仍稳固轮换!防守协作成球队关键,罚球联盟第一!
- 2026年1月28日:雷霆13连胜爆冲突!亚历山大29分锡安21+11锁定联盟第一
- 2026年1月28日:斯普利特点赞杨瀚森攻防两端,亲承增加上场时间,开拓者小将轮换价值获认可
- 2026年1月28日:外资变“姿势”拥抱中国:2025年外资数据呈现双变化 引发产业观察
- 2026年1月28日:阿里云通义开源Z-Image基座模型,生成图片拒绝AI‘大众脸’
- 2026年1月28日:华硕破晓Ultra轻薄本震撼发布:搭载酷睿Ultra X7、2.8K OLED触控屏
- 2026年1月28日:长城魏牌V9X旗舰SUV官宣,魏建军称‘保定人心中的大旗杆立起来了’
- 2026年1月28日:微软预计2030年数据中心用水近800亿升,承诺推进节水计划

精彩评论(10)