DeepSeek首次回应“蒸馏OpenAI”质疑，登《Nature》封面！

2025年9月18日

（图片来自网络）

9月18日，DeepSeek引发科技界关注！由DeepSeek团队完成的DeepSeek-R1研究论文，登上国际权威期刊《Nature》封面，这是AI领域的重要突破。

今年1月，DeepSeek发布初版预印本论文后，此次《Nature》版本补充了更多模型细节，同时回应了“蒸馏OpenAI”的核心质疑。在补充材料中，DeepSeek明确R1模型的训练成本仅29.4万美元，并阐述了训练数据来源与处理方式。

针对此前关于DeepSeek可能“蒸馏OpenAI”的质疑，DeepSeek在补充资料中说明，V3-Base训练数据来自普通网页和电子书，不包含合成数据；同时表示已处理预训练数据中的“数据污染”，并采用群组相对策略优化（GRPO）降低训练成本，设计奖励机制与引导模板提升推理能力。

DeepSeek-R1采用强化学习激发推理能力，通过奖励机制让模型在解答数学问题时获得高分、答错受惩罚，逐步学习推理并自我验证，在编程等复杂问题上表现优异。此外，团队直接使用DeepSeek-R1的样本微调其他开源模型，显著增强小模型推理能力。

目前，DeepSeek-R1作为开源推理模型，在Hugging Face下载量超1090万次，也是首个经同行评审的主流大语言模型，其研究成果为AI行业发展提供新思路。