DeepSeek新模型Model1曝光:或推新架构,最快2月发布
(图片来自网络)
IT之家 1 月 21 日消息,The Information 月初爆料显示,DeepSeek 计划于今年 2 月中旬左右(农历新年期间)推出新一代旗舰 AI 模型——DeepSeek V4,将具备更强代码撰写能力。1 月 20 日,在 DeepSeek-R1 发布一周年之际,开发者发现 DeepSeek 在 GitHub 中更新了 FlashMLA 代码,该代码覆盖 114 个文件,其中 28 处提及未知的“MODEL1”大模型标识符。
该标识符与现有模型“V32”(即 DeepSeek-V3.2)并列或区分提及。代码上下文分析表明,“MODEL1”极有可能是基于新架构的大模型。开发者分析指出,“MODEL1”与“V32”在关键技术上存在差异,主要体现在键值(KV)缓存布局、稀疏性处理方式及对 FP8 数据格式的解码支持等方面。这些差异显示新架构在内存优化和计算效率上做了针对性设计。
此前,DeepSeek 研究团队还发布了两篇技术论文,分别介绍“优化残差连接(mHC)”新训练方法与“AI 记忆模块(Engram)”,此举引发猜测——新模型或整合这些最新研究成果。目前预计“MODEL1”相关进展最快于 2 月发布,值得关注。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:昨日社会热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日文化热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日科技热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日体育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日娱乐热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日财经热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日教育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日汽车热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行

精彩评论(10)