百度百舸开源生产级代码 联合SGLang社区打造先进AI基础设施

2025年12月18日
news

(图片来自网络)

近年来,Token消耗量呈年均百倍增长趋势。国家数据局数据显示,我国日均Token消耗量从2024年初的1000亿突破至30万亿,仅一年半增长超300倍。随着DeepSeek、Ernie等MoE类推理模型流行,大规模分布式推理系统建设成为AI落地关键挑战。为应对行业难题,12月14日百度百舸与SGLang社区联合举办技术分享活动,共同分享生产级代码与先进AI基础设施成果。

活动上,百度智能云AI计算首席科学家王雁鹏表示,百度百舸将生产级代码持续开源到开源社区,分享大规模生产环境积累的大模型训推系统能力,包括稳定、优化的核心组件。王雁鹏强调,开源是长期技术方向,未来会持续联合社区推动行业成长。

百度智能云10月已携手SGLang社区开源针对DeepSeek-V3.2推理性能优化的MTP技术代码,社区实测显示该技术让DeepSeek-V3.2解码吞吐量提升超2倍。

百度百舸团队在活动中分享大规模分布式推理基础设施实践。主任架构师田健介绍,新一代基础设施以自动化编排、静默实例、高性能调度三大支柱破解大模型部署“不可能三角”,优化推理效率与稳定性。高级架构师刘伟分享基于万卡级生产系统对DeepSeek V3.2推理引擎的轻量级CPE与ESS系统优化,破解长文本推理显存墙难题。高级工程师刘国维带来DeepSeek V3系列模型的AE分离框架实战,平衡性能、稳定性与运维复杂度。

SGLang社区方面,核心开发者分享了优化成果。张懿带来SGLang在Linear Model与Diffusion支持的最新进展,社区通过工程优化适配新一代模型结构,推动从语言模型走向统一生成引擎。SGLang Diffusion团队介绍其性能优势,将Diffusion推理性能提升至Diffusers的2–6倍,为统一模型预留优化空间。开发者还展示了投机推理与强化学习场景的进展,拓展推理框架适用边界。

未来,百度将持续联合开源社区打造先进AI基础设施,满足Token消耗增长诉求,推动大模型推理系统发展。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-12-18 12
    热情支持这种联合开源模式,对行业发展很关键,期待更多成果落地。
  • 网友9 2025-12-18 12
    通过这次学习,了解到大模型推理的复杂性和优化方向,以后在项目中可以借鉴这些经验,提升效率。
  • 网友8 2025-12-18 12
    为这种开源合作点赞!对普通开发者来说,能拿到生产级代码太棒了,希望更多企业这样做。
  • 网友7 2025-12-18 12
    从技术角度分析,百度百舸的开源和SGLang的合作确实能推动行业进步,不过需要持续跟进实践效果。
  • 网友6 2025-12-18 12
    大模型推理就像解谜,现在开源这些代码,相当于给everyone发了谜题攻略,大家一起玩得开心~
  • 网友5 2025-12-18 12
    从技术角度来看,百度和SGLang的合作在AI基础设施领域很领先,开源实践为行业提供了很好参考。
  • 网友4 2025-12-18 12
    这次开源和合作很专业,对学习AI基础设施和推理系统很有启发,希望有更多实践机会。
  • 网友3 2025-12-18 12
    大模型和代码开源,感觉未来科技发展会越来越方便,希望有更多学习资源。
  • 网友2 2025-12-18 12
    百度和社区合作很靠谱,这些技术分享能帮我们优化系统,提升效率。
  • 网友1 2025-12-18 12
    开源代码很实用,对学习大模型推理很有帮助,希望更多企业参与。
查看“百度百舸开源生产级代码 联合SGLang社区打造先进AI基础设施”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙