DeepSeek V3.1实测：上下文与功能升级解析

2025年8月20日

（图片来自网络）

DeepSeek V3.1模型更新后，上下文长度拓展至128K，在编程、写作、翻译等多领域展现新变化，记者实测对比解析如下：

与V3相比，V3.1最显著更新为上下文长度提升，且支持多种张量格式。网页端界面“深度思考(R1)”已更新为简洁版，手机端也在逐步适配（笑）。

测试通过阿里云调用API，对比两个版本表现。开学季特设试卷，从五个“学科”考察：

1. 编程能力测试：

以“将GIF图压缩到10M以下”为例，V3.1给出的代码更全面，涵盖依赖库说明、使用步骤，甚至原理讲解。原文件18.3MB的GIF，用V3.1代码压缩后直接满足要求，而V3需额外步骤。画面对比显示V3.1处理速度更快（可查看附图）。

2. 情境写作测试：

以上海卷高考作文题为例，V3.1写作风格更文艺，对比V3的理性表达，更贴近人文气质。主考官更偏爱风格多元的V3.1（可左右滑动查看作文对比）。

3. 数学理解应用：

测试双曲线题目（全国一卷第3题），两个版本均正确，但V3.1呈现更简洁，符合数学问题解答习惯。

4. 翻译水平测试：

翻译生物学术论文摘要，V3.1长难句处理更好，但存在个别词汇遗漏；V3多用括号补充。两者各有优劣，V3.1更注重流畅度。

5. 冷门知识测试：

测试“构树果实类别”，V3.1认为核果，但表述存在小失误，小红书博主通过解剖确认是瘦果，体现知识更新需持续验证。

此外，V3.1在Reddit等平台测试中，非推理模型SOTA得分71.6%，与竞争对手比表现优异，且配置优化（新增特殊token），搜索状态下自动搜索功能也引发关注。

目前，完整的DeepSeek V3.1 Base版本可通过抱抱脸、网页、APP和小程序使用，网页端已全部更新，API测试显示性能提升明显。