DeepSeek开源图像存储新模型,以图片为AI记忆载体创新记忆方式

(图片来自网络)
DeepSeek昨天开源了一款名为DeepSeek-OCR的新模型,这个模型让AI能够以图片作为“记忆载体”,在科技领域实现了创新记忆方式,堪称一次重要突破!
传统的大模型主要依靠文字(token)来存储信息,而DeepSeek这次尝试用图片来承载信息,结果发现这种方式能够存储更多的内容,压缩比更是达到了十分之一!
- 技术优势:使用不到十分之一的视觉token,就能存储几乎相同数量的文字信息;
- 识别能力:不仅能识别图片中的文字,还能识别图表、分子结构等图像内容,并能自动转化为标准格式(如Excel、SMILES)来保存;
- 资源节省:运行时更节省计算资源,对话时的上下文处理效率更高,减少了算力成本;
- 开源特性:整合了华为Wukong、百度PaddleOCR、Meta SAM、OpenAI CLIP等全球开源社区的成果,让技术发展更加开放,更多开发者能参与其中。
在测试中,DeepSeek-OCR仅使用100个视觉token就超过了需要256个token的传统模型,而且即使压缩20倍后,仍能保持较高准确率。同时,它支持多种分辨率和压缩模式,能适应不同复杂度的文档,还能模拟人类遗忘规律,通过“Gundam模式”调整记忆深度,为AI的上下文能力带来新思路。
这款模型的价值不仅在于技术创新,还能帮助收集更多二维数据资源,将过去未被采集的图像信息纳入学习素材,成为大模型的“养料”,对AI行业的发展有重要推动作用。通过开源,它也吸引了全球技术社区的参与,让更多人能参与到技术发展和创新中。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年10月22日:商用量子计算机或5年内问世!全球竞速,谁拔头筹
- 2025年10月22日:亚马逊云服务故障波及多领域影响全球公司
- 2025年10月22日:‘你知道自己是AI吗?’热梗流行 网友把AI玩出趣味
- 2025年10月22日:潘建伟:第二次量子革命需长期耐心与支持
- 2025年10月22日:NASA重启登月竞标引局长之争 马斯克发声抨击局长
- 2025年10月22日:欧冠4冠王阿贾克斯开局3连败垫底 滕哈格或回归救火
- 2025年10月22日:欧冠赛程精彩瞬间:皇马小胜尤文,利物浦止连败,拜仁大胜布鲁日
- 2025年10月22日:利物浦1.4亿欧元引进球星半场被换,8次出场仅1球引发关注
- 2025年10月22日:亚马逊推出三合一仓库机器人 摩根士丹利预计2027年降本40亿美元
- 2025年10月22日:8次扑救力保零封 维卡里奥当选摩纳哥vs热刺比赛最佳
- 2025年10月22日:法兰克福欧冠三场比赛比分均为5-1 独特战绩引关注
- 2025年10月22日:埃基蒂克欧冠进球后感言:感恩法兰克福 成就自我
- 2025年10月22日:小米汽车回应网传SOS宣传失实:系AI生成谣言
- 2025年10月22日:欧冠第三轮比赛日:拜仁、切尔西爆发,利物浦反超,皇马低迷
- 2025年10月22日:阿贾克斯半场丢4球1-4负切尔西 创队史时隔67年欧战纪录
- 2025年10月22日:比Transformer更强的架构来了?浙大新作Translution,一统卷积和自注意力
- 2025年10月22日:谷歌量子计算创纪录:碾压超算13000倍,登Nature封面
- 2025年10月22日:毕包3-1逆转卡拉巴赫,古鲁泽塔双响助球队获胜
- 2025年10月22日:罗本现身安联球场 照片曝光引发关注
- 2025年10月22日:欧冠首胜诞生!两队终结连败拿到历史胜利,比赛数据更新
精彩评论(10)