106B参数AI模型借分布式强化学习开源,512张H200助力实现领先表现
(图片来自网络)
近日,Prime Intellect推出了一款名为INTELLECT - 3的AI模型,这是一款拥有106B参数的混合专家(Mixture-of-Experts, MoE)模型,在数学、代码、科学推理等领域的基准测试中表现出众,成为同规模模型中的强者。更值得关注的是,Prime Intellect将其完整的训练技术栈——包括模型权重、训练框架、数据集、强化学习环境与评测体系全部开源,为AI技术发展注入新动力。
该模型的核心亮点在于利用分布式强化学习(RL)技术,在64个互联节点部署的512张NVIDIA H200 GPU上完成了训练调度与管理。这种分布式训练方式让模型在处理大规模任务时效率更高,展现出强大性能。Prime Intellect的开源举措,让更多人有机会接触并参与到前沿AI模型的训练研究中。
训练过程中,Prime Intellect自研了PRIME - RL分布式RL框架,该框架与Verifiers环境、Environments Hub深度整合,构建出高效训练体系。此外,自研的Prime Sandboxes基础设施为强化学习训练提供了安全、高吞吐的代码执行环境,确保训练过程稳定高效。
INTELLECT - 3的训练方案分为两个阶段:基于GLM - 4.5 - Air的监督微调,以及大规模强化学习训练,整个过程在512张H200 GPU上持续了两个月。未来,Prime Intellect计划进一步扩展智能体式强化学习环境,让AI在更多任务中展现优势,推动技术普及。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月10日:理想AI眼镜Livis搭载恒玄科技BES2800BP芯片,2000元起售功能升级
- 2025年12月10日:亚马逊宣布未来五年在印度投资350亿美元,瞄准AI和物流基础设施
- 2025年12月10日:申花外援战亚冠赛前晒照:最后一舞 合同月底到期
- 2025年12月10日:力箭一号遥十一发射圆满成功!一箭九星服务多国客户,中国商业航天国际化再创佳绩
- 2025年12月10日:华为MatePad Air 2025等设备开启HarmonyOS 6公测版升级尝鲜
- 2025年12月10日:泡泡玛特“星星人”IP入驻美颜相机 美颜相机推潮玩联名新玩法
- 2025年12月10日:智谱AutoGLM开源,与豆包手机引发AI终端‘安卓苹果’之争
- 2025年12月10日:AI点亮五育 南沙教育数字变革实践
- 2025年12月10日:美团无人机低空航网发布会定档12月19日 多款新品将集中亮相
- 2025年12月10日:马斯克旗下AI聊天机器人Grok11月流量创新高 超越多款对手并披露更新安排
- 2025年12月10日:尼克斯35分逆转猛龙晋级NBA杯四强 布伦森、哈特、英格拉姆数据亮眼
- 2025年12月10日:林昀儒逆转杜达晋级男单八强 四连胜彰显竞技风采
- 2025年12月10日:马斯克旗下SpaceX或迎史上最大IPO?估值与募资金额引市场关注
- 2025年12月10日:杭州商业航天火箭基地落地,最快明年首飞瞄准‘半小时全球直达’
- 2025年12月10日:比特币,从神秘诞生到全球关注|画说热点
- 2025年12月10日:制度创新护航生态环境持续改善:《生态环境监测条例》正式施行
- 2025年12月10日:广州“十四五”发展成就:“老城新事,智造温情”的高光篇章
- 2025年12月10日:上观时评 | 展望新发展①让更多民生利好‘直达个人’,为什么重要?
- 2025年12月10日:你追我赶与携手并肩:企业竞合发展观察
- 2025年12月10日:第四次!灵魂社交神器Soul死磕上市,这次能通关吗?

精彩评论(10)