DeepSeek首次回应“蒸馏OpenAI”质疑,登《Nature》封面!

(图片来自网络)
9月18日,DeepSeek引发科技界关注!由DeepSeek团队完成的DeepSeek-R1研究论文,登上国际权威期刊《Nature》封面,这是AI领域的重要突破。
今年1月,DeepSeek发布初版预印本论文后,此次《Nature》版本补充了更多模型细节,同时回应了“蒸馏OpenAI”的核心质疑。在补充材料中,DeepSeek明确R1模型的训练成本仅29.4万美元,并阐述了训练数据来源与处理方式。
针对此前关于DeepSeek可能“蒸馏OpenAI”的质疑,DeepSeek在补充资料中说明,V3-Base训练数据来自普通网页和电子书,不包含合成数据;同时表示已处理预训练数据中的“数据污染”,并采用群组相对策略优化(GRPO)降低训练成本,设计奖励机制与引导模板提升推理能力。
DeepSeek-R1采用强化学习激发推理能力,通过奖励机制让模型在解答数学问题时获得高分、答错受惩罚,逐步学习推理并自我验证,在编程等复杂问题上表现优异。此外,团队直接使用DeepSeek-R1的样本微调其他开源模型,显著增强小模型推理能力。
目前,DeepSeek-R1作为开源推理模型,在Hugging Face下载量超1090万次,也是首个经同行评审的主流大语言模型,其研究成果为AI行业发展提供新思路。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月18日:快手推出OneSearch,革新电商搜索体验
- 2025年9月18日:创历史!GPT - 5全球编程大赛夺冠,人类排名第二,北交大团队国内领先
- 2025年9月18日:从公众号智能体看AI Agent的工业化发展路径
- 2025年9月18日:华为发布全球最强算力超节点与集群 徐直军:全面领先!
- 2025年9月18日:黄河旋风子公司引入战略投资,有望突破国外半导体衬底材料垄断
- 2025年9月18日:云计算厂商竞逐AI与出海 腾讯云战略布局加速
- 2025年9月18日:Claude CEO预警:未来5年近半白领岗位或被AI替代
- 2025年9月18日:2026款腾势N9上市,比亚迪全球化进阶再下一城
- 2025年9月18日:OPPO K15 系列新增 6.5X 中屏 高配测试骁龙 8 Gen5 处理器
- 2025年9月18日:追觅汽车官图发布 新技术亮眼
- 2025年9月18日:孙兴慜6场5球完成帽子戏法 助洛杉矶4-1获胜
- 2025年9月18日:华为Atlas 950超级集群50万卡超集群计划2026年Q4上市
- 2025年9月18日:万字长文 | AI落地的十大问题
- 2025年9月18日:鸿蒙智行智界ADS 4.0升级计划公布:周五启动、9月23日全量推送
- 2025年9月18日:金九银十BBA燃油车促销热潮:多款车型优惠超10万 奥迪A4L跌入20万元内
- 2025年9月18日:12国官员来渝交流 助推新能源汽车标准跨国互认
- 2025年9月18日:科学家造出最接近真实的人工肾脏,多领域科技突破引关注
- 2025年9月18日:华为徐直军部署芯片三年计划 推“超节点+集群”算力方案
- 2025年9月18日:DeepSeek R1 登《Nature》封面 梁文锋通讯作者创AI历史
- 2025年9月18日:Meta首款带显示AI眼镜发布 新引擎推动AI创作
精彩评论(10)