AI2开源具身机器人AI模型MolmoAct,实现三重空间感知
(图片来自网络)
Ai2研究机构在GitHub开源了其MolmoAct机器人“行动推理模型”,为具身机器人场景提供三重空间感知能力。
模型核心亮点:
- 突破三维空间限制:克服传统视觉语言行动模型的不足,解决三维环境深度与距离表达问题。
- 三阶段动作规划:
- 第一阶段生成由VQVAE预训练得到的带几何结构与位置信息的Token,用于评估物体间距离并规划基础
- 第二阶段在图像空间生成一系列路径点,直观展示动作展开的顺序
- 第三阶段将路径点转化为机器人末端执行器或机械爪的低层马达指令,结合运动学配置解码动作
- 测试表现优异:在模拟测试环境中,MolmoAct-7B在未见任务中达72.1%成功率,经高效参数微调后平均成功率提升至86.6%,优于多实验室对照模型。
- 低训练成本:预训练仅用256颗H100 GPU约1天完成(2630万样本),微调用64颗H100约2小时。
- 提升可解释性与安全性:执行前叠加运动轨迹到输入图像,支持用户查看修正;允许手绘标注目标姿态或路径,模型即时整合调整。
Ai2已同步开源MolmoAct-7B完整资源(https://github.com/allenai/MolmoAct),助力其他研究团队在不同机器人平台与任务中验证优化,推动具身机器人技术发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:2025中国经济关键词:潜力释放 激活超大规模市场优势
- 2026年1月28日:大转折!2025年制造业利润大幅回升,反“内卷”改善价格预期
- 2026年1月28日:2026年中国外贸发展方向:从关键词看新布局
- 2026年1月28日:金沙江鱼儿回家之路:隧洞刷脸、电梯通行,生态保护见成效
- 2026年1月28日:走进“冰雪热”幕后:吉林省冰雪经济背后的劳动者故事
- 2026年1月28日:非洲留学生“小米”变身长沙经贸“纽带”,用直播架起中非经贸之桥
- 2026年1月28日:“一降一增”见证中国外贸破局前行
- 2026年1月28日:春晚未启,AI先战!字节、腾讯、百度大厂抢位AI超级入口
- 2026年1月28日:谷歌云上调部分数据传输服务价格 北美地区价格翻倍
- 2026年1月28日:苹果计划维持iPhone 18起售价 面对内存成本上涨
- 2026年1月28日:中国科学家研发‘智能电子衣’ 实现器官精准可控给药
- 2026年1月28日:曦望发布新一代推理GPU芯片S3 2025交付破万片 推动‘百万Token一分钱’落地
- 2026年1月28日:中国豪华车老大之争:奥迪凭啥干掉奔驰宝马?
- 2026年1月28日:泰国U23国脚提拉帕租借加盟J联赛札幌队 比肩中国赛展现才华
- 2026年1月28日:德约科维奇赢9盘进澳网四强?对比2016年美网仅赢8盘,是大满贯最幸运之旅吗?
- 2026年1月28日:蚂蚁GPASS技术与小米智能眼镜合作 推出停车缴费、AI健康等智能服务
- 2026年1月28日:斯坦福联合英伟达提出新方法:测试时强化学习攻克科学难题
- 2026年1月28日:美国宇航局朱诺号探测到木卫二冰壳厚度约29公里 探索宇宙新发现
- 2026年1月28日:真我回归OPPO后首款机型成爆款 真我Neo8销量领先竞品
- 2026年1月28日:成都两会科技亮点:全球首款‘成都造’熊猫人形机器人震撼登场

精彩评论(10)