DeepSeek V3.1实测:上下文与功能升级解析
(图片来自网络)
DeepSeek V3.1模型更新后,上下文长度拓展至128K,在编程、写作、翻译等多领域展现新变化,记者实测对比解析如下:
与V3相比,V3.1最显著更新为上下文长度提升,且支持多种张量格式。网页端界面“深度思考(R1)”已更新为简洁版,手机端也在逐步适配(笑)。
测试通过阿里云调用API,对比两个版本表现。开学季特设试卷,从五个“学科”考察:
- 计算机(编程能力)
- 语文(情境写作)
- 数学(理解应用)
- 外语(翻译水平)
- 拓展(冷门知识)
1. 编程能力测试:
以“将GIF图压缩到10M以下”为例,V3.1给出的代码更全面,涵盖依赖库说明、使用步骤,甚至原理讲解。原文件18.3MB的GIF,用V3.1代码压缩后直接满足要求,而V3需额外步骤。画面对比显示V3.1处理速度更快(可查看附图)。
2. 情境写作测试:
以上海卷高考作文题为例,V3.1写作风格更文艺,对比V3的理性表达,更贴近人文气质。主考官更偏爱风格多元的V3.1(可左右滑动查看作文对比)。
3. 数学理解应用:
测试双曲线题目(全国一卷第3题),两个版本均正确,但V3.1呈现更简洁,符合数学问题解答习惯。
4. 翻译水平测试:
翻译生物学术论文摘要,V3.1长难句处理更好,但存在个别词汇遗漏;V3多用括号补充。两者各有优劣,V3.1更注重流畅度。
5. 冷门知识测试:
测试“构树果实类别”,V3.1认为核果,但表述存在小失误,小红书博主通过解剖确认是瘦果,体现知识更新需持续验证。
此外,V3.1在Reddit等平台测试中,非推理模型SOTA得分71.6%,与竞争对手比表现优异,且配置优化(新增特殊token),搜索状态下自动搜索功能也引发关注。
目前,完整的DeepSeek V3.1 Base版本可通过抱抱脸、网页、APP和小程序使用,网页端已全部更新,API测试显示性能提升明显。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月4日:滴滴推出宠物生活服务,上门喂猫遛狗等覆盖25城
- 2025年11月4日:vivo Y500 Pro上架电信终端产品库,首发三星2亿像素主摄新机登场
- 2025年11月4日:Gartner的AI存储大考,华为交出“超高分答卷”
- 2025年11月4日:齐沃谈欧冠对阵首次参赛队:强调“无压力”对手最危险
- 2025年11月4日:青年欧冠皇马4-0狂胜利物浦 迭戈-阿瓜多传射助球队四连胜
- 2025年11月4日:欧冠赛场新纪录可期!阿森纳有望成英格兰第二支前四轮零封夺冠球队
- 2025年11月4日:萨内谈世界杯与国家队:通过表现争取征召,点赞孔帕尼领袖力
- 2025年11月4日:信号满格不代表网速快?手机显示的“谎言”你该了解
- 2025年11月4日:Palantir CEO抨击‘大空头’做空行为:称对AI领军企业‘疯狂’
- 2025年11月4日:二维码有‘自愈’能力:遮挡四分之一仍可扫
- 2025年11月4日:华为WATCH FIT 3手表迎来鸿蒙HarmonyOS 5.0.0.28系统升级更新
- 2025年11月4日:山姆因APP改版和前阿里高管上任遭网友吐槽,会员体验成热点
- 2025年11月4日:双11手机推荐指南:这些机型“香”翻网友,刚需党别错过!
- 2025年11月4日:苹果iOS 26.1更新:液态玻璃设自主选择,多项实用功能上新
- 2025年11月4日:京东APP首页新增自营秒送专区,自营配送更便捷
- 2025年11月4日:蓝牙名字的有趣秘密:源自10世纪北欧国王
- 2025年11月4日:昨日社会热门资讯汇总-早报速览(2025-11-04)
- 2025年11月4日:昨日文化热门资讯汇总-早报速览(2025-11-04)
- 2025年11月4日:昨日科技热门资讯汇总-早报速览(2025-11-04)
- 2025年11月4日:昨日体育热门资讯汇总-早报速览(2025-11-04)

精彩评论(10)