苹果新AI模型长视频理解夺冠,小规模版本也领先对手
(图片来自网络)
苹果研究团队开源了 SlowFast-LLaVA-1.5 长视频多模态大语言模型,在1B、3B、7B等参数规模下,刷新了 LongVideoBench、MLVU 等多项行业基准纪录。甚至小至1B版本的模型也领先竞争对手,展现了强大长视频理解能力。
该模型针对现有大语言模型处理视频存在的3重局限性(依赖长上下文窗口、训练管道复杂、仅针对视频优化),创新了双流(慢流、快流)设置。其中,“慢流” 选取少量高分辨率帧捕捉场景细节,“快流” 选取更多低分辨率帧追踪运动变化,适配128帧输入(快流96帧、慢流32帧)。
- 该模型在知识问答、数学推理、OCR等图像相关任务也表现出色,实现视频与图像通用理解;
- 完全基于公开数据集训练,方便学术与产业复现;
- 已在GitHub与Hugging Face开源,促进AI技术发展。
测试显示,该模型不仅长视频理解能力领先,1B版本也能在多项基准上超越对手,为AI行业带来新突破。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:昨日社会热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日文化热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日科技热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日体育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日娱乐热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日财经热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日教育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日汽车热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行

精彩评论(10)