国产算力预训练突破!开元-2B全流程开源,AI新生态诞生
(图片来自网络)
国产算力驱动的人工智能模型预训练迎来重要突破!
鹏城实验室与清华大学PACMAN实验室联合发布的开元-2B模型,以全流程开源的方式展现了国产算力下的预训练新可能。
该模型从训练数据、数据处理框架、训练框架到技术报告,全部实现开源共享,为AI研究者提供可复现的技术路径,推动国产AI生态共建。
开元-2B模型依托鹏城脑海2计算平台,采用华为鲲鹏920与昇腾910A国产硬件,在训练稳定性方面实现重大突破。研究团队引入三明治范数与软裁剪技术,有效解决FP16环境下训练稳定性问题,为后续国产平台大规模训练提供重要参考。
数据处理环节,团队开发Kaiyuan-Spark框架实现高效全局去重,提出分位标定方法建立数据质量评价标准。通过分位标定发现,高质量数据占比虽小却是提升模型能力的关键,为数据筛选与利用提供科学依据。
开元-2B还提出多阶段动态比例调整、课程学习等策略,优化数据效用分布,提升模型性能。全流程开源让训练数据、框架、技术报告等全部公开,为其他研究者提供完整工具箱,加速技术迭代。
目前,模型权重、技术报告及相关代码已在官方平台发布,欢迎开发者、研究者共同参与测试、改进与拓展,共同推动国产算力下的AI技术发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月21日:千兆宽带缩水引争议:体验感成运营商服务缺口
- 2025年12月21日:MiniMax招股书解析:全球领先大模型成本仅为OpenAI 1% 展现高效研发
- 2025年12月21日:巴萨2-0击败黄潜!拉菲尼亚点射+亚马尔破门,韦加飞铲染红
- 2025年12月21日:博洛尼亚主席:对阵那不勒斯才是真正的意大利超级杯决赛
- 2025年12月21日:德甲第15轮半场战况:拜仁2-0领先海登海姆,斯塔尼希奇与奥利塞建功
- 2025年12月21日:上海交大AI生成操作系统新突破:提出文件系统开发新范式
- 2025年12月21日:福田汽车发布多款战略级新产品,精准卡位商用车绿色智能转型关键节点
- 2025年12月21日:男子沉迷AI聊天就医:“完美伴侣”成情感依赖隐患
- 2025年12月21日:特斯拉Model Y用户手册更新:新增视频查看挡位等信息功能
- 2025年12月21日:智能金融进入深水区:模型迭代等多重挑战引关注
- 2025年12月21日:苹果MacOS 26更新后显示器频繁闪烁 官方多次更新问题未缓解
- 2025年12月21日:当人工智能深度介入创作 这场跨界沙龙共话视觉叙事的边界与可能
- 2025年12月21日:西甲比赛中维加飞铲亚马尔遭红牌,巴萨球员集体不满
- 2025年12月21日:马竞替补球员西甲进球数领跑,赛季竞技状态惹关注
- 2025年12月21日:都灵以点球1-0击败萨索洛 弗拉希奇立功制胜
- 2025年12月21日:昨日社会热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日文化热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日科技热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日体育热门资讯汇总-早报速览(2025-12-21)
- 2025年12月21日:昨日娱乐热门资讯汇总-早报速览(2025-12-21)

精彩评论(10)