国产算力预训练突破!开元-2B全流程开源,AI新生态诞生
(图片来自网络)
国产算力驱动的人工智能模型预训练迎来重要突破!
鹏城实验室与清华大学PACMAN实验室联合发布的开元-2B模型,以全流程开源的方式展现了国产算力下的预训练新可能。
该模型从训练数据、数据处理框架、训练框架到技术报告,全部实现开源共享,为AI研究者提供可复现的技术路径,推动国产AI生态共建。
开元-2B模型依托鹏城脑海2计算平台,采用华为鲲鹏920与昇腾910A国产硬件,在训练稳定性方面实现重大突破。研究团队引入三明治范数与软裁剪技术,有效解决FP16环境下训练稳定性问题,为后续国产平台大规模训练提供重要参考。
数据处理环节,团队开发Kaiyuan-Spark框架实现高效全局去重,提出分位标定方法建立数据质量评价标准。通过分位标定发现,高质量数据占比虽小却是提升模型能力的关键,为数据筛选与利用提供科学依据。
开元-2B还提出多阶段动态比例调整、课程学习等策略,优化数据效用分布,提升模型性能。全流程开源让训练数据、框架、技术报告等全部公开,为其他研究者提供完整工具箱,加速技术迭代。
目前,模型权重、技术报告及相关代码已在官方平台发布,欢迎开发者、研究者共同参与测试、改进与拓展,共同推动国产算力下的AI技术发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月21日:29岁哈佛学霸开发“药界ChatGPT”,OpenAI连投三轮估值92亿
- 2025年12月21日:摩尔线程技术路线图曝光:冲击十万卡集群
- 2025年12月21日:圆桌论坛:具身数据如何塑造行业未来?——GAIR 2025 数据专题对话
- 2025年12月21日:荣耀WIN系列手机搭载鸿燕通信系统与抢网双芯 12月26日发布
- 2025年12月21日:本周AI安全项目推荐:“守护Vibe Coding安全”的VibeSec类产品
- 2025年12月21日:摩尔线程开发者大会发布全功能GPU技术,接近英伟达生态
- 2025年12月21日:杨立昆创办新公司AMI,拟募资5亿欧元开发世界模型AI
- 2025年12月21日:手机壳‘爱马仕’涨价热销 华强北20元仿货泛滥显商业现象
- 2025年12月21日:100岁寿辰!祝贺宜兴籍岩土工程专家周镜院士!
- 2025年12月21日:重庆发放国内首块L3级自动驾驶专用号牌,智能网联汽车产业迈上新征程
- 2025年12月21日:陶虹豪宅与生活近况曝光,装修简洁女儿神态像徐峥
- 2025年12月21日:霍启山婚姻难破家族门槛?门第规则成关键
- 2025年12月21日:广汽埃安举办用户节,深化番禺行动推进品牌改革,实现用户价值突围
- 2025年12月21日:NBA爆冷!灰熊遭联盟倒数第一奇才20分逆转 阿尔达马37+10生涯新高
- 2025年12月21日:高价预估低价收购手机?回收平台消费陷阱引关注
- 2025年12月21日:英伟达联合多机构研发NitroGen开源模型,千款游戏与机器人领域获新突破
- 2025年12月21日:加密货币对冲基金今年遇挫 暴露行业系统性风险
- 2025年12月21日:2025车市销量格局颠覆:小车成王者,比亚迪退守,行业竞争重塑
- 2025年12月21日:苹果AI团队权力交接,复旦校友接任基础模型团队
- 2025年12月21日:极摩客NucBox K15迷你主机发布 配置丰富支持外接显卡

精彩评论(10)