科研团队突破SAM限制,推出图像与视频统一上下文分割新方法
(图片来自网络)
近期,由北京邮电大学联合南洋理工大学等机构的研究团队,提出了一种突破SAM(Segment Anything Model)交互限制的图像与视频上下文分割方法,相关成果发表于IEEE Transaction on Pattern Analysis and Machine Intelligence(TPAMI)期刊,构建了首个视频上下文分割基准IC-VOS,为视觉大模型在图像和视频领域的应用提供了新突破。
上下文分割(In-Context Segmentation)需要模型通过参考示例指导分割特定目标,但SAM虽能零样本泛化,却受限于提示构建(如点、框)制约,难以在复杂连续视频中维持时空一致性。研究团队提出DC-SAM框架,该框架采用基于循环一致性的提示微调机制,通过正负双分支与循环一致性注意力协同,配合Mask-Tube策略,实现了SAM与SAM2在图像及视频上下文分割任务的统一与高效适配。
实验结果显示,DC-SAM在多个基准测试中取得领先性能:在COCO-20i图像基准上达到55.5 mIoU,在Pascal-5i图像基准上达到73.0 mIoU;在团队首创的视频基准IC-VOS上,J&F得分高达71.52,显著优于现有方法。该研究不仅解决了SAM在上下文分割的局限性,还为视觉大模型在工业与科研领域的落地应用提供了更具竞争力的解决方案。
DC-SAM框架由三部分核心组成:基于SAM的特征融合、正负双分支循环一致性提示生成、面向视频的Mask-tube训练策略。其中,循环一致性注意力的引入有效解决了视频分割中语义漂移问题,而Mask-tube策略则赋予了模型处理时空动态的能力,使得方法在图像与视频场景下均能高效实现上下文分割。
研究团队还构建了首个视频上下文分割基准IC-VOS,填补了该领域空白,为后续研究提供了统一测试平台。该论文已被IEEE TPAMI录用,相关代码和资源已公开,方便业界更多人研究和应用。
最新新闻
- 2026年1月28日:昨日社会热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日文化热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日科技热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日体育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日娱乐热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日财经热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日教育热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:昨日汽车热门资讯汇总-早报速览(2026-01-28)
- 2026年1月28日:迈阿密国际新援雷吉隆右膝关节受伤 归期待定
- 2026年1月28日:阿森纳联赛阶段11连胜仅丢4球 本赛季前7场率先破门
- 2026年1月28日:交通运输部加强春运公路水路服务保障 推出保畅组合拳
- 2026年1月28日:凡人微光|冰雪热潮中的平凡热爱故事
- 2026年1月28日:冰雪产业焕新:冷资源变热经济,打造全年发展‘旺火’
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行

精彩评论(10)