DeepSeek首次回应“蒸馏OpenAI”质疑,登《Nature》封面!

2025年9月18日
news

(图片来自网络)

9月18日,DeepSeek引发科技界关注!由DeepSeek团队完成的DeepSeek-R1研究论文,登上国际权威期刊《Nature》封面,这是AI领域的重要突破。


今年1月,DeepSeek发布初版预印本论文后,此次《Nature》版本补充了更多模型细节,同时回应了“蒸馏OpenAI”的核心质疑。在补充材料中,DeepSeek明确R1模型的训练成本仅29.4万美元,并阐述了训练数据来源与处理方式。


针对此前关于DeepSeek可能“蒸馏OpenAI”的质疑,DeepSeek在补充资料中说明,V3-Base训练数据来自普通网页和电子书,不包含合成数据;同时表示已处理预训练数据中的“数据污染”,并采用群组相对策略优化(GRPO)降低训练成本,设计奖励机制与引导模板提升推理能力。


DeepSeek-R1采用强化学习激发推理能力,通过奖励机制让模型在解答数学问题时获得高分、答错受惩罚,逐步学习推理并自我验证,在编程等复杂问题上表现优异。此外,团队直接使用DeepSeek-R1的样本微调其他开源模型,显著增强小模型推理能力。


目前,DeepSeek-R1作为开源推理模型,在Hugging Face下载量超1090万次,也是首个经同行评审的主流大语言模型,其研究成果为AI行业发展提供新思路。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-18 12
    开源模型发展很快,给大家带来便利
  • 网友9 2025-09-18 12
    强化学习思路很聪明,效果真好
  • 网友8 2025-09-18 12
    大模型训练透明化好,让人信任
  • 网友7 2025-09-18 12
    研究团队很认真,成果很有价值
  • 网友6 2025-09-18 12
    科技界创新不断,感觉未来很精彩
  • 网友5 2025-09-18 12
    AI推理能力提升的方法值得学习
  • 网友4 2025-09-18 12
    模型训练成本省不少,发展方式有新方向
  • 网友3 2025-09-18 12
    DeepSeek回应质疑很专业,成果很棒
  • 网友2 2025-09-18 12
    科技越来越厉害,以后生活会更方便
  • 网友1 2025-09-18 12
    大模型发展这么快,技术进步让人惊叹
查看“DeepSeek首次回应“蒸馏OpenAI”质疑,登《Nature》封面!”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙