DeepSeek新模型Model1曝光:或推新架构,最快2月发布

2026年1月21日
news

(图片来自网络)

IT之家 1 月 21 日消息,The Information 月初爆料显示,DeepSeek 计划于今年 2 月中旬左右(农历新年期间)推出新一代旗舰 AI 模型——DeepSeek V4,将具备更强代码撰写能力。1 月 20 日,在 DeepSeek-R1 发布一周年之际,开发者发现 DeepSeek 在 GitHub 中更新了 FlashMLA 代码,该代码覆盖 114 个文件,其中 28 处提及未知的“MODEL1”大模型标识符。

该标识符与现有模型“V32”(即 DeepSeek-V3.2)并列或区分提及。代码上下文分析表明,“MODEL1”极有可能是基于新架构的大模型。开发者分析指出,“MODEL1”与“V32”在关键技术上存在差异,主要体现在键值(KV)缓存布局、稀疏性处理方式及对 FP8 数据格式的解码支持等方面。这些差异显示新架构在内存优化和计算效率上做了针对性设计。

此前,DeepSeek 研究团队还发布了两篇技术论文,分别介绍“优化残差连接(mHC)”新训练方法与“AI 记忆模块(Engram)”,此举引发猜测——新模型或整合这些最新研究成果。目前预计“MODEL1”相关进展最快于 2 月发布,值得关注。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-21 09
    AI发展太快了,希望新模型靠谱,别出问题
  • 网友9 2026-01-21 09
    关注技术细节,代码差异显示创新点,值得关注
  • 网友8 2026-01-21 09
    希望新模型能更好写代码,我编程总是卡
  • 网友7 2026-01-21 09
    新架构如果真提升效率,对开发者很有用
  • 网友6 2026-01-21 09
    Model1会不会成为“模式一”?AI名字也流行文化了
  • 网友5 2026-01-21 09
    技术发展不能太快太乱,得慢慢来
  • 网友4 2026-01-21 09
    这AI新模型会怎么改变生活呀,好奇代码里藏了啥
  • 网友3 2026-01-21 09
    哇,新模型2月发布太期待了,AI发展太快啦!
  • 网友2 2026-01-21 09
    新模型架构变化可能提升效率,值得期待
  • 网友1 2026-01-21 09
    DeepSeekModels1看着挺新奇的,能早点用上AI帮帮忙
查看“DeepSeek新模型Model1曝光:或推新架构,最快2月发布”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙