SGLang原生适配昇腾平台,新模型一键运行无需代码修改
(图片来自网络)
在AI大模型推理领域,昇腾作为主流算力平台,与SGLang推理引擎的协同成为行业焦点。近日,SGLang原生支持昇腾平台,让DeepSeek、Qwen、GLM等大模型能在昇腾硬件上直接运行,无需调整模型参数或安装额外插件,展现大模型推理与算力生态的协同进步。
此次合作聚焦大模型推理效率与工程实践,SGLang推理引擎更新后,整合HiCache、Mooncake等系统能力,形成从缓存、内存到算力优化的完整推理路径。支持新模型在昇腾平台上实现“一键拉起”,降低开发与部署成本。
核心亮点:
- 模型适配:支持DeepSeek、Qwen等多类开源模型,在昇腾硬件上实现Day0直接运行,简化部署流程。
- 系统优化:HiCache扩展缓存至CPU与远端存储, Mooncake优化权重更新与冷启动效率;Slime系统定制强化学习训练,提升训练与推理效率。
- 生态协同:昇腾作为主流后端,深度融入SGLang主仓库,推动AI算力与开源推理框架的融合发展。
实测数据显示,昇腾在处理PD分离、长上下文推理等场景时,吞吐达15TPS/卡,推理时延约4秒,展现高吞吐、低延迟性能。这一进展标志着昇腾从单一硬件支持向“推理系统生态协同”转变,为未来规模化AI应用提供稳定基础。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月21日:昨日社会热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日文化热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日科技热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日体育热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日娱乐热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日军事热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日财经热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日汽车热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日健康热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日历史热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:清华博士创业打造个人超算,用亲民价格拓展计算能力边界
- 2025年12月21日:上交团队实现新一代光计算芯片突破,开辟算力芯片新路径
- 2025年12月21日:商汤发布开悟世界模型3.0,具身智能从硬件转向大脑升级
- 2025年12月21日:二手显卡捡漏:玩家仅花约60元购得GTX 1660S
- 2025年12月21日:OPPO Watch X3智能手表通过工信部核准 预计和OPPO Find N6同步发布
- 2025年12月21日:摩尔线程开发者大会发布全功能GPU架构及系列新品,推动国产算力生态进阶
- 2025年12月21日:米哈游等科技巨头押注,MiniMax成功通过港交所聆讯
- 2025年12月21日:外卖骑士算法变革始于普陀,惠及全国
- 2025年12月21日:石宇奇总决赛爆冷不敌小波波夫,卫冕失利无缘羽毛球历史第二人
- 2025年12月21日:郭艾伦赛季首次缺席广州战江苏,徐昕27+14+4帽终结对手4连败

精彩评论(10)