DeepSeek开源图像存储新模型，以图片为AI记忆载体创新记忆方式

2025年10月22日

（图片来自网络）

DeepSeek昨天开源了一款名为DeepSeek-OCR的新模型，这个模型让AI能够以图片作为“记忆载体”，在科技领域实现了创新记忆方式，堪称一次重要突破！

传统的大模型主要依靠文字（token）来存储信息，而DeepSeek这次尝试用图片来承载信息，结果发现这种方式能够存储更多的内容，压缩比更是达到了十分之一！

开源特性：整合了华为Wukong、百度PaddleOCR、Meta SAM、OpenAI CLIP等全球开源社区的成果，让技术发展更加开放，更多开发者能参与其中。

在测试中，DeepSeek-OCR仅使用100个视觉token就超过了需要256个token的传统模型，而且即使压缩20倍后，仍能保持较高准确率。同时，它支持多种分辨率和压缩模式，能适应不同复杂度的文档，还能模拟人类遗忘规律，通过“Gundam模式”调整记忆深度，为AI的上下文能力带来新思路。

这款模型的价值不仅在于技术创新，还能帮助收集更多二维数据资源，将过去未被采集的图像信息纳入学习素材，成为大模型的“养料”，对AI行业的发展有重要推动作用。通过开源，它也吸引了全球技术社区的参与，让更多人能参与到技术发展和创新中。