灵感实验室推出Glint-MVT v2.0：统一图像与视频编码，革新VLM视频分析效率

2026年1月20日

（图片来自网络）

出品 | 网易科技《态度》栏目作者 | 纪川编辑 | 定西

世界不是由静态图片组成的，而是连续流动的视频。以往AI处理视频常将视频解压为一帧帧图片逐一分析，导致算力浪费。灵感实验室推出的Glint-MVT v2.0（MVT v2.0）以“图像和视频统一编码”的方式，在视频压缩域高效分析视频，大幅提升VLM（视觉语言模型）视频分析效率与能力，打破传统视频分析模式。

MVT v2.0的核心突破在于利用视频编码的运动矢量（Motion Vector）和残差（Residual）信息，生成“信息量热图”。模型仅保留包含关键动作或细节变化的图像块，直接丢弃背景等低信息量的部分，直接减少90%的冗余Token。这种策略使全帧率分析速度提升了5倍，且在MVBench、VideoMME等视频基准测试中超过Google SigLIP2。

从2023年Glint-MVT v1.0开始，灵感实验室持续迭代。v1.0和v1.1聚焦于图像编码的优化，v1.5则提升了局部细节的理解能力，最终在v2.0阶段实现图像与视频的统一编码。目前，MVT v2.0已应用于安防、银行等领域，未来将探索更高效、流式、3D重建等方向，推动视频理解与生成一体化。

网易科技与灵感实验室团队的对话显示，MVT v2.0的“统一编码”思路是利用视频本身压缩后的特征，不再处理冗余信息，直接对变化部分分析。团队负责人表示，此技术希望给视觉研究者带来启发，开辟新的分析路径，未来将持续优化，提升分析能力。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2026-01-20 17

视频和图像统一后，未来应用场景肯定更多，很期待！
网友9 2026-01-20 17

压缩域分析有意义，既节省资源又能提高效率，很合理。
网友8 2026-01-20 17

技术积累多年才有这样的突破，团队很厉害，很佩服！
网友7 2026-01-20 17

统一编码后视频分析更高效了，以后很多场景都能受益。
网友6 2026-01-20 17

AI在视频分析方面的进步越来越大，这个方案确实很实用。
网友5 2026-01-20 17

用视频编码原理提升效率，这个思路很有创新性，未来肯定好用。
网友4 2026-01-20 17

视频和图像统一编码后，算力节省不少，对行业来说是重大利好。
网友3 2026-01-20 17

从1.0到2.0，技术迭代很稳，团队对细节很用心，值得点赞！
网友2 2026-01-20 17

终于有技术不用把视频当成图片来分析了，太聪明了，期待应用。
网友1 2026-01-20 17

这个技术对视频分析很有帮助，以后安防监控能更高效工作！

查看“灵感实验室推出Glint-MVT v2.0：统一图像与视频编码，革新VLM视频分析效率”相关搜索 >

灵感实验室推出Glint-MVT v2.0：统一图像与视频编码，革新VLM视频分析效率

精彩评论（10）

最新新闻