DeepSeek开源图像存储新模型,以图片为AI记忆载体创新记忆方式

(图片来自网络)
DeepSeek昨天开源了一款名为DeepSeek-OCR的新模型,这个模型让AI能够以图片作为“记忆载体”,在科技领域实现了创新记忆方式,堪称一次重要突破!
传统的大模型主要依靠文字(token)来存储信息,而DeepSeek这次尝试用图片来承载信息,结果发现这种方式能够存储更多的内容,压缩比更是达到了十分之一!
- 技术优势:使用不到十分之一的视觉token,就能存储几乎相同数量的文字信息;
- 识别能力:不仅能识别图片中的文字,还能识别图表、分子结构等图像内容,并能自动转化为标准格式(如Excel、SMILES)来保存;
- 资源节省:运行时更节省计算资源,对话时的上下文处理效率更高,减少了算力成本;
- 开源特性:整合了华为Wukong、百度PaddleOCR、Meta SAM、OpenAI CLIP等全球开源社区的成果,让技术发展更加开放,更多开发者能参与其中。
在测试中,DeepSeek-OCR仅使用100个视觉token就超过了需要256个token的传统模型,而且即使压缩20倍后,仍能保持较高准确率。同时,它支持多种分辨率和压缩模式,能适应不同复杂度的文档,还能模拟人类遗忘规律,通过“Gundam模式”调整记忆深度,为AI的上下文能力带来新思路。
这款模型的价值不仅在于技术创新,还能帮助收集更多二维数据资源,将过去未被采集的图像信息纳入学习素材,成为大模型的“养料”,对AI行业的发展有重要推动作用。通过开源,它也吸引了全球技术社区的参与,让更多人能参与到技术发展和创新中。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年10月22日:800多位世界名流联名呼吁禁止开发超级智能
- 2025年10月22日:三星Galaxy S26搭载猎户座Exynos 2600芯片跑分曝光:不及骁龙8至尊版
- 2025年10月22日:余承东宣布鸿蒙5终端设备数突破2300万
- 2025年10月22日:大众电动情怀车ID. Buzz将暂停生产 遭遇市场冷遇
- 2025年10月22日:ICCV最佳论文出炉,朱俊彦团队积木研究摘得桂冠
- 2025年10月22日:奈飞因6亿美元税务支出,三季度营业利润率不及预期 引发股价波动
- 2025年10月22日:AI玩具开启产业‘黄金时代’
- 2025年10月22日:首颗“雄安造”卫星成功下线,实现从“0到1”重大跨越
- 2025年10月22日:广东发布‘AI+制造’三年行动方案 助力制造业智能化升级
- 2025年10月22日:一加Ace 6系列新机曝光:骁龙8 Gen5芯片配超大电池
- 2025年10月22日:OpenAI推出ChatGPT Atlas浏览器 挑战谷歌网络霸权
- 2025年10月22日:核聚变商业化加速,高温超导材料迎来发展机遇
- 2025年10月22日:奇瑞捷途纵横G700水陆两栖SUV横渡长江 展现汽车技术新突破
- 2025年10月22日:Dexbotic开源!具身智能VLA平台性能突破,机器人叠盘子100%成功
- 2025年10月22日:车主购买小米汽车遭品牌销售言论引争议,涉事4S店回应处理
- 2025年10月22日:缅怀杨振宁先生:追思科学贡献与社会情怀
- 2025年10月22日:顶尖科学家探讨抗衰老与AI影响:人类与数学家未来回应
- 2025年10月22日:东莞三场AI座谈会推动规模化应用与产业化落地
- 2025年10月22日:AI时代ERP变革:SAP的战略引领与行业转型
- 2025年10月22日:菜鸟跨境物流拓展拉美市场,三季度单量实现三位数增长
精彩评论(10)