DeepSeek V3.1实测:上下文与功能升级解析
(图片来自网络)
DeepSeek V3.1模型更新后,上下文长度拓展至128K,在编程、写作、翻译等多领域展现新变化,记者实测对比解析如下:
与V3相比,V3.1最显著更新为上下文长度提升,且支持多种张量格式。网页端界面“深度思考(R1)”已更新为简洁版,手机端也在逐步适配(笑)。
测试通过阿里云调用API,对比两个版本表现。开学季特设试卷,从五个“学科”考察:
- 计算机(编程能力)
- 语文(情境写作)
- 数学(理解应用)
- 外语(翻译水平)
- 拓展(冷门知识)
1. 编程能力测试:
以“将GIF图压缩到10M以下”为例,V3.1给出的代码更全面,涵盖依赖库说明、使用步骤,甚至原理讲解。原文件18.3MB的GIF,用V3.1代码压缩后直接满足要求,而V3需额外步骤。画面对比显示V3.1处理速度更快(可查看附图)。
2. 情境写作测试:
以上海卷高考作文题为例,V3.1写作风格更文艺,对比V3的理性表达,更贴近人文气质。主考官更偏爱风格多元的V3.1(可左右滑动查看作文对比)。
3. 数学理解应用:
测试双曲线题目(全国一卷第3题),两个版本均正确,但V3.1呈现更简洁,符合数学问题解答习惯。
4. 翻译水平测试:
翻译生物学术论文摘要,V3.1长难句处理更好,但存在个别词汇遗漏;V3多用括号补充。两者各有优劣,V3.1更注重流畅度。
5. 冷门知识测试:
测试“构树果实类别”,V3.1认为核果,但表述存在小失误,小红书博主通过解剖确认是瘦果,体现知识更新需持续验证。
此外,V3.1在Reddit等平台测试中,非推理模型SOTA得分71.6%,与竞争对手比表现优异,且配置优化(新增特殊token),搜索状态下自动搜索功能也引发关注。
目前,完整的DeepSeek V3.1 Base版本可通过抱抱脸、网页、APP和小程序使用,网页端已全部更新,API测试显示性能提升明显。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:昨日社会热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日文化热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日科技热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日体育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日娱乐热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日财经热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日教育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日汽车热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行

精彩评论(10)