DeepSeek V3.1实测:上下文与功能升级解析

2025年8月20日
news

(图片来自网络)




DeepSeek V3.1实测:上下文与功能升级解析


DeepSeek V3.1模型更新后,上下文长度拓展至128K,在编程、写作、翻译等多领域展现新变化,记者实测对比解析如下:


与V3相比,V3.1最显著更新为上下文长度提升,且支持多种张量格式。网页端界面“深度思考(R1)”已更新为简洁版,手机端也在逐步适配(笑)。


测试通过阿里云调用API,对比两个版本表现。开学季特设试卷,从五个“学科”考察:



  • 计算机(编程能力)

  • 语文(情境写作)

  • 数学(理解应用)

  • 外语(翻译水平)

  • 拓展(冷门知识)


1. 编程能力测试


以“将GIF图压缩到10M以下”为例,V3.1给出的代码更全面,涵盖依赖库说明、使用步骤,甚至原理讲解。原文件18.3MB的GIF,用V3.1代码压缩后直接满足要求,而V3需额外步骤。画面对比显示V3.1处理速度更快(可查看附图)。


2. 情境写作测试


以上海卷高考作文题为例,V3.1写作风格更文艺,对比V3的理性表达,更贴近人文气质。主考官更偏爱风格多元的V3.1(可左右滑动查看作文对比)。


3. 数学理解应用


测试双曲线题目(全国一卷第3题),两个版本均正确,但V3.1呈现更简洁,符合数学问题解答习惯。


4. 翻译水平测试


翻译生物学术论文摘要,V3.1长难句处理更好,但存在个别词汇遗漏;V3多用括号补充。两者各有优劣,V3.1更注重流畅度。


5. 冷门知识测试


测试“构树果实类别”,V3.1认为核果,但表述存在小失误,小红书博主通过解剖确认是瘦果,体现知识更新需持续验证。


此外,V3.1在Reddit等平台测试中,非推理模型SOTA得分71.6%,与竞争对手比表现优异,且配置优化(新增特殊token),搜索状态下自动搜索功能也引发关注。


目前,完整的DeepSeek V3.1 Base版本可通过抱抱脸、网页、APP和小程序使用,网页端已全部更新,API测试显示性能提升明显。



(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-20 16
    SOTA得分这么高,说明实力过硬,以后用着更放心~
  • 网友9 2025-08-20 16
    手机端还在适配,等完全适配后用起来更方便,急等更新~
  • 网友8 2025-08-20 16
    冷门知识测试也勉强过了,说明模型学习面广,未来还有空间~
  • 网友7 2025-08-20 16
    翻译和写作都提升,以后做文档翻译更高效,大大提升工作效率!
  • 网友6 2025-08-20 16
    数学题解得很好,数学差的同学可能有救了,感谢科技发展~
  • 网友5 2025-08-20 16
    编程的代码讲解很详细,学生做作业时能直接复制用,省时间。
  • 网友4 2025-08-20 16
    简单又好上手,老人用着也没问题,界面变化不大还更流畅!
  • 网友3 2025-08-20 16
    上下文到128K很厉害,以后能处理更多内容,方便很多科技爱好者~
  • 网友2 2025-08-20 16
    写作风格变文艺了,对学生的作文辅助应该不错,期待应用在教学中~
  • 网友1 2025-08-20 16
    这个新版本在编程方面提升明显,对学习编程很有帮助啊!
查看“DeepSeek V3.1实测:上下文与功能升级解析”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙