DeepSeek开源图像存储新模型,以图片为AI记忆载体创新记忆方式

2025年10月22日
news

(图片来自网络)

DeepSeek昨天开源了一款名为DeepSeek-OCR的新模型,这个模型让AI能够以图片作为“记忆载体”,在科技领域实现了创新记忆方式,堪称一次重要突破!


传统的大模型主要依靠文字(token)来存储信息,而DeepSeek这次尝试用图片来承载信息,结果发现这种方式能够存储更多的内容,压缩比更是达到了十分之一!



  • 技术优势:使用不到十分之一的视觉token,就能存储几乎相同数量的文字信息;

  • 识别能力:不仅能识别图片中的文字,还能识别图表、分子结构等图像内容,并能自动转化为标准格式(如Excel、SMILES)来保存;

  • 资源节省:运行时更节省计算资源,对话时的上下文处理效率更高,减少了算力成本;

  • 开源特性:整合了华为Wukong、百度PaddleOCR、Meta SAM、OpenAI CLIP等全球开源社区的成果,让技术发展更加开放,更多开发者能参与其中。


在测试中,DeepSeek-OCR仅使用100个视觉token就超过了需要256个token的传统模型,而且即使压缩20倍后,仍能保持较高准确率。同时,它支持多种分辨率和压缩模式,能适应不同复杂度的文档,还能模拟人类遗忘规律,通过“Gundam模式”调整记忆深度,为AI的上下文能力带来新思路。


这款模型的价值不仅在于技术创新,还能帮助收集更多二维数据资源,将过去未被采集的图像信息纳入学习素材,成为大模型的“养料”,对AI行业的发展有重要推动作用。通过开源,它也吸引了全球技术社区的参与,让更多人能参与到技术发展和创新中。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-10-22 01
    开源整合多社区成果,技术更开放,未来肯定有新突破!
  • 网友9 2025-10-22 01
    得考虑数据安全和识别准确性,需要完善。
  • 网友8 2025-10-22 01
    科技发展让人惊喜,新模型让AI学习更高效,未来应用空间大!
  • 网友7 2025-10-22 01
    感觉像AI长出‘视觉记忆’第二大脑,太有创意了!
  • 网友6 2025-10-22 01
    创新用图像存储,对大模型发展有推动,开源后社区能跟进,有意义!
  • 网友5 2025-10-22 01
    从技术角度,压缩比和资源节省可行,需验证应用效率。
  • 网友4 2025-10-22 01
    太酷了,以后写论文、识别图表方便了,AI帮忙整理信息!
  • 网友3 2025-10-22 01
    虽岁数大,但科技发展快,这模型创新多,咱也能用上便捷处。
  • 网友2 2025-10-22 01
    用图片存储,能减少计算资源,以后用大模型更省成本,期待应用!
  • 网友1 2025-10-22 01
    这模型太厉害了,以后AI能记住更多图片信息,学习资源更丰富了!
查看“DeepSeek开源图像存储新模型,以图片为AI记忆载体创新记忆方式”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙