苹果新AI模型长视频理解夺冠,小规模版本也领先对手

(图片来自网络)
苹果研究团队开源了 SlowFast-LLaVA-1.5 长视频多模态大语言模型,在1B、3B、7B等参数规模下,刷新了 LongVideoBench
、MLVU
等多项行业基准纪录。甚至小至1B版本的模型也领先竞争对手,展现了强大长视频理解能力。
该模型针对现有大语言模型处理视频存在的3重局限性(依赖长上下文窗口、训练管道复杂、仅针对视频优化),创新了双流(慢流、快流)设置。其中,“慢流” 选取少量高分辨率帧捕捉场景细节,“快流” 选取更多低分辨率帧追踪运动变化,适配128帧输入(快流96帧、慢流32帧)。
- 该模型在知识问答、数学推理、OCR等图像相关任务也表现出色,实现视频与图像通用理解;
- 完全基于公开数据集训练,方便学术与产业复现;
- 已在GitHub与Hugging Face开源,促进AI技术发展。
测试显示,该模型不仅长视频理解能力领先,1B版本也能在多项基准上超越对手,为AI行业带来新突破。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月16日:小鹏汇天飞行器演练相撞起火,官方回应间距不足
- 2025年9月16日:理想i6纯电五座SUV定档9月26日发布
- 2025年9月16日:刘强东直播炒菜表态:京东酒旅要创新 停止‘价格战’
- 2025年9月16日:上海申花亚冠首战告负!近7战仅1胜,全场仅2射送韩国新军队史首胜
- 2025年9月16日:世锦赛110米栏:中国选手发挥欠佳无缘决赛
- 2025年9月16日:亚冠赛场冲突事件!于汉超飞铲被罚黄牌,申花比赛遭遇逆转
- 2025年9月16日:特谢拉半场压哨破门!申花亚冠客场终结315天球荒
- 2025年9月16日:新石器无人车获阿布扎比首张无人配送车牌照
- 2025年9月16日:记者分析亚冠赛制与跨年模式,呼吁推进赛制改革
- 2025年9月16日:FC26日本球员评分公布:球员得分情况一览
- 2025年9月16日:意甲球队拟引进中国足球新星王钰栋 父亲关注首发保障
- 2025年9月16日:英特尔中国区董事长王锐将退休 管理层交接迎新阶段
- 2025年9月16日:胡杏儿:从北爱尔兰到演艺巨星,倔强女性的励志人生
- 2025年9月16日:陈数婚姻困局:为继子放弃生育,丈夫绯闻引争议,给女性以警示
- 2025年9月16日:李玉刚:从《星光大道》成名到争议中的艺术轨迹
- 2025年9月16日:鲁梅尼格点赞新欧冠赛制更精彩 顶级豪门不敢再松懈联赛阶段
- 2025年9月16日:数字化推动文化遗产保护传承与活化利用
- 2025年9月16日:数字化赋能文化遗产,焕发新生机——2025世界互联网大会文化遗产数字化论坛聚焦传承
- 2025年9月16日:万名师生沉浸式感悟延安精神 沉浸式思政大课燃动青春
- 2025年9月16日:以光影为桥,金熊猫奖助推全球文明之花绽放
精彩评论(10)