Physical Intelligence研究证实人机迁移能力与预训练多样性正相关
(图片来自网络)
机器人初创公司Physical Intelligence近日发表研究,发现机器人领域“人机迁移能力”与“预训练多样性”呈正相关,为机器人智能发展提供重要新视角。
核心发现:当Visual-Language-Action(VLA)模型在足够多样化的场景、任务和机器人形态上完成预训练后,具备从人类视频中学习技能并迁移到机器人执行的能力,此前依赖的显式对齐技术可能不再必要。
- VLA模型若预训练规模或多样性不足,加入人类视频可能无益甚至负迁移;
- 充足预训练后,模型跨越“跨具身形态鸿沟”能力显现,泛化任务性能翻倍;
- 研究强调预训练多样性与规模的重要性,需先构建充足多样数据集才能有效利用人类视频。
图 | 相关论文(来源:Physical Intelligence)
研究从“人机迁移”与“预训练多样性”角度,验证了机器人基础模型类似大语言模型的“规模门槛效应”,即能力随预训练多样性提升而“涌现”。
团队通过联合训练方案(混合人类与机器人数据),发现当预训练多样性逐渐提升时,人类视频带来的增益显著上升,泛化任务性能翻倍。例如任务泛化测试中,未用人类数据的模型分拣鸡蛋准确率约57%,联合训练后达78%,学会了“分拣”语义概念。
机理分析显示,充分多样化预训练使模型形成“具身无关”的中间表示,让人类与机器人动作在语义层面可映射,无需显式对齐。
另外,研究也指出人类数据非万能,部分任务机器人数据更优,因此人类视频是补充数据源,非替代方案。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月17日:谷歌推出Gemini 3 Flash模型,成AI规模化落地关键一步
- 2025年12月17日:谷歌发布Gemini 3 Flash高效AI模型 挑战OpenAI成应用搜索默认驱动
- 2025年12月17日:米兰拟以1000万欧元租借菲尔克鲁格附买断权
- 2025年12月17日:意媒曝国米瞄准尤文旧将阿尔贝托-科斯塔 替代邓弗里斯
- 2025年12月17日:米兰正与西汉姆联谈判菲尔克鲁格租借转会事宜
- 2025年12月17日:国米接近终止卡尔博尼租借 热那亚有望放人寻求新机会
- 2025年12月17日:马竞队史10次国王杯夺冠,近28年夺冠次数仅1次
- 2025年12月17日:桑托斯欲续约内马尔 弗拉门戈也有意
- 2025年12月17日:马竞客场挑战巴利阿里 格列兹曼、加拉格尔首发出战
- 2025年12月17日:利物浦索博有望出战热刺,乔-戈麦斯本周末暂不回归
- 2025年12月17日:巴黎队史第8次征战洲际赛事决赛 创法国俱乐部纪录
- 2025年12月17日:切尔西、热刺争抢朗斯中场桑加雷,球员更倾向加盟曼联
- 2025年12月17日:智驾人才涌入具身智能领域 风投追逐新赛道
- 2025年12月17日:别把AI写代码当赌博:从Vibe Coding到Vibe Engineering
- 2025年12月17日:Google 发布 Gemini 3 Flash 轻量模型,性能反超同代旗舰版
- 2025年12月17日:95后双星闪耀AI圈,两位天才主导技术新方向
- 2025年12月17日:阿里千问新功能上线,AI视频创作变得更简单有趣
- 2025年12月17日:从“卷算力”到“造场景”,AI重塑文创产业新生态
- 2025年12月17日:年度词汇‘Slop’引热议,迪士尼用AI生成内容成焦点
- 2025年12月17日:2025大都市规划国际咨询会‘人工智能与空间提质’平行论坛:专家共探数智空间治理新路径

精彩评论(10)