灵感实验室推出Glint-MVT v2.0:统一图像与视频编码,革新VLM视频分析效率
(图片来自网络)
出品 | 网易科技《态度》栏目 作者 | 纪川 编辑 | 定西
世界不是由静态图片组成的,而是连续流动的视频。以往AI处理视频常将视频解压为一帧帧图片逐一分析,导致算力浪费。灵感实验室推出的Glint-MVT v2.0(MVT v2.0)以“图像和视频统一编码”的方式,在视频压缩域高效分析视频,大幅提升VLM(视觉语言模型)视频分析效率与能力,打破传统视频分析模式。
MVT v2.0的核心突破在于利用视频编码的运动矢量(Motion Vector)和残差(Residual)信息,生成“信息量热图”。模型仅保留包含关键动作或细节变化的图像块,直接丢弃背景等低信息量的部分,直接减少90%的冗余Token。这种策略使全帧率分析速度提升了5倍,且在MVBench、VideoMME等视频基准测试中超过Google SigLIP2。
从2023年Glint-MVT v1.0开始,灵感实验室持续迭代。v1.0和v1.1聚焦于图像编码的优化,v1.5则提升了局部细节的理解能力,最终在v2.0阶段实现图像与视频的统一编码。目前,MVT v2.0已应用于安防、银行等领域,未来将探索更高效、流式、3D重建等方向,推动视频理解与生成一体化。
网易科技与灵感实验室团队的对话显示,MVT v2.0的“统一编码”思路是利用视频本身压缩后的特征,不再处理冗余信息,直接对变化部分分析。团队负责人表示,此技术希望给视觉研究者带来启发,开辟新的分析路径,未来将持续优化,提升分析能力。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:昨日社会热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日文化热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日科技热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日体育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日娱乐热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日财经热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日教育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日汽车热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行

精彩评论(10)