灵感实验室推出Glint-MVT v2.0:统一图像与视频编码,革新VLM视频分析效率

2026年1月20日
news

(图片来自网络)

出品 | 网易科技《态度》栏目 作者 | 纪川 编辑 | 定西


世界不是由静态图片组成的,而是连续流动的视频。以往AI处理视频常将视频解压为一帧帧图片逐一分析,导致算力浪费。灵感实验室推出的Glint-MVT v2.0(MVT v2.0)以“图像和视频统一编码”的方式,在视频压缩域高效分析视频,大幅提升VLM(视觉语言模型)视频分析效率与能力,打破传统视频分析模式。


MVT v2.0的核心突破在于利用视频编码的运动矢量(Motion Vector)和残差(Residual)信息,生成“信息量热图”。模型仅保留包含关键动作或细节变化的图像块,直接丢弃背景等低信息量的部分,直接减少90%的冗余Token。这种策略使全帧率分析速度提升了5倍,且在MVBench、VideoMME等视频基准测试中超过Google SigLIP2。


从2023年Glint-MVT v1.0开始,灵感实验室持续迭代。v1.0和v1.1聚焦于图像编码的优化,v1.5则提升了局部细节的理解能力,最终在v2.0阶段实现图像与视频的统一编码。目前,MVT v2.0已应用于安防、银行等领域,未来将探索更高效、流式、3D重建等方向,推动视频理解与生成一体化。


网易科技与灵感实验室团队的对话显示,MVT v2.0的“统一编码”思路是利用视频本身压缩后的特征,不再处理冗余信息,直接对变化部分分析。团队负责人表示,此技术希望给视觉研究者带来启发,开辟新的分析路径,未来将持续优化,提升分析能力。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-20 17
    视频和图像统一后,未来应用场景肯定更多,很期待!
  • 网友9 2026-01-20 17
    压缩域分析有意义,既节省资源又能提高效率,很合理。
  • 网友8 2026-01-20 17
    技术积累多年才有这样的突破,团队很厉害,很佩服!
  • 网友7 2026-01-20 17
    统一编码后视频分析更高效了,以后很多场景都能受益。
  • 网友6 2026-01-20 17
    AI在视频分析方面的进步越来越大,这个方案确实很实用。
  • 网友5 2026-01-20 17
    用视频编码原理提升效率,这个思路很有创新性,未来肯定好用。
  • 网友4 2026-01-20 17
    视频和图像统一编码后,算力节省不少,对行业来说是重大利好。
  • 网友3 2026-01-20 17
    从1.0到2.0,技术迭代很稳,团队对细节很用心,值得点赞!
  • 网友2 2026-01-20 17
    终于有技术不用把视频当成图片来分析了,太聪明了,期待应用。
  • 网友1 2026-01-20 17
    这个技术对视频分析很有帮助,以后安防监控能更高效工作!
查看“灵感实验室推出Glint-MVT v2.0:统一图像与视频编码,革新VLM视频分析效率”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙