VLA技术深度解析:对话专家解析自动驾驶与具身智能新纪元
(图片来自网络)
VLA(视觉语言动作大模型)作为连接自动驾驶与具身智能的关键技术,正推动智能领域实现技术跃迁。本次我们邀请到小米汽车智能驾驶VLA技术负责人陈龙与上海交通大学计算机学院助理教授、ScaleLab负责人穆尧,围绕VLA技术内核、挑战与前景展开深度对话。
- 一、什么是VLA?
DeepTech:先请两位解释一下什么是VLA技术。
陈龙:VLA是利用大语言模型的泛化能力,结合互联网预训练的通识知识与语言推理能力,解决现实行为决策问题。在自动驾驶和机器人领域,VLA借助大模型能力,利用通识知识与推理能力优化决策。
穆尧:VLA给机器人带来泛化能力,使机器人能通过语言理解人类指令,结合视觉语言模型预训练能力实现场景与视觉泛化,并衔接动作决策模块。
- 二、VLA与端到端自动驾驶的区别
DeepTech:VLA技术自动驾驶上,和现在的端到端自动驾驶有什么区别?
陈龙:端到端自动驾驶早期依赖模块化感知、预测、规划算法,VLA则通过大语言模型引入语言推理能力,提升决策可解释性与长尾问题泛化性,赋予“看了就懂、懂了就做”的认知能力。
- 三、什么是长尾问题和泛化问题?
DeepTech:两位反复提到长尾和泛化。能不能举一些特殊的例子,帮助我们了解机器人或自动驾驶在某些场景下失效的情况?
穆尧:机器人场景可从背景、前景、杂物、物体等层级举例。自动驾驶则以路口标识、未知场景为例,说明长尾问题对决策的影响。
陈龙:自动驾驶长尾问题体现在未知场景、特殊标识等,VLA可通过语言推理提升应对能力。
- 四、VLA不只是加了一层语言
DeepTech:传统或现在用的是从视觉直接映射到动作,VLA是从视觉映射到语言再映射到动作。是不是只是在中间加了一层语言?还是VLA中间加入语言能解决一些其他核心问题?
陈龙:VLA是范式转变,利用大模型能力,通过语言模态引入推理与知识,解决决策问题,而非简单叠加。
穆尧:VLA结合视觉语言与动作决策,赋予机器人语言理解与推理能力,提升任务执行灵活性。
- 五、机器人对语言的要求更高
DeepTech:在机器人上呢?
穆尧:机器人VLA需高语言能力,需将抽象指令拆解为动作原语,VLA结合视觉语言模型与动作专家网络,满足机器人多任务、开放世界需求。
陈龙:自动驾驶与机器人均需语言能力,VLA通过语言模态拓展决策维度。
- 六、安全性问题:如何保证VLA不出错?
DeepTech:不管自动驾驶还是机器人,安全性都是关键。如何看待语言模型幻觉问题?
穆尧:通过强化学习等方式提升安全性,结合传统算法冗余保障,实现工业场景高可靠性要求。
陈龙:自动驾驶需系统级安全冗余,结合传统感知与规控算法做安全检查,应对VLA决策潜在风险。
- 七、实时性问题:VLA的延迟怎么解决?
DeepTech:另一个我比较关心的点是,如果加入语言的决策逻辑,模型延迟问题怎么解决?
陈龙:自动驾驶要求实时响应,VLA可通过双系统(慢推理、快决策)结合,优化网络结构提升效率。
穆尧:机器人可通过异步推理、并行化等方式优化延迟,结合云端与端侧协同实现高效决策。
- 八、思考与执行可以并行
DeepTech:思考链与执行过程并行,如何解决遗忘问题?
陈龙:训练时优化预训练与finetune策略,推理时压缩上下文、总结关键信息,解决遗忘与延迟问题。
穆尧:机器人执行时通过显性总结、隐式嵌入等方式处理记忆与遗忘问题,优化决策效率。
- 九、世界模型与空间智能:争论还是融合?
DeepTech:世界模型与空间智能等技术的争论,两位怎么看?
穆尧:空间智能与语言模型均重要,世界模型提供通用空间推理能力,与语言模型可融合提升具身智能效果。
陈龙:VLA与世界模型解决不同问题,可结合提升智能驾驶能力。
- 十、如何看待对VLA技术的质疑?
DeepTech:如何看待对VLA技术质疑?
穆尧:技术路线不同,VLA是前沿技术,需长期发展,最终会实现融合与共识。
陈龙:技术发展有阶段,不能因当前问题否定潜力,VLA是物理世界AGI重要方向。
以下是本次对话的完整内容,通过两位专家解析VLA技术的本质、挑战与前景,为智能领域技术发展提供深度参考。
最新新闻
- 2026年1月24日:NASA拟用PC跑分工具CapFrameX测试飞船驾驶舱模拟器性能
- 2026年1月24日:三星Exynos 2600芯片GPU性能表现优异 稳定性超骁龙8 Elite Gen 5
- 2026年1月24日:V聚场创作空间供不应求,大学路二期今年亮相
- 2026年1月24日:OPPO Find X9 Ultra三月登场:机圈最强望远镜来了
- 2026年1月24日:大疆Osmo Pocket 4 Pro手持云台相机现身,横排双摄设计
- 2026年1月24日:苏州姑苏区推出200万元奖励补贴政策 支持OPC创业新政
- 2026年1月24日:徐杰伤退广东主场击败山西 两队犯规大战4人被罚下
- 2026年1月24日:保罗伤愈出战澳网1/8决赛 对阵世界第一阿尔卡拉斯
- 2026年1月24日:CBA球员伤情更新:徐杰崴脚无大碍,赵睿赴院检查
- 2026年1月24日:罗德·拉沃尔球场关闭顶棚引澳网争议,规则与运气成焦点讨论
- 2026年1月24日:广东省政协委员提议AI机器人参与养老,开辟产业新赛道
- 2026年1月24日:2026苹果新机有望不涨价?iPhone 17e或4499元起
- 2026年1月24日:全球首份动力电池循环经济研究报告发布,宁德时代参与支持
- 2026年1月24日:开箱广货爆款!中国无人机“飞向世界”,广东占据C位
- 2026年1月24日:Cursor 300万行代码测试暴露AI编程危机
- 2026年1月24日:2026北京两会对话:市政协委员解析“AI+教育”发展关键期与市场格局
- 2026年1月24日:北大副教授死磕机器人大脑,剖析具身领域‘偏见’问题
- 2026年1月24日:上海菜场偶遇黄仁勋!全球科技首富逛菜市场引热议
- 2026年1月24日:U23国足亚洲杯首战首发出炉:向余望连场先发,拜合拉木替补登场
- 2026年1月24日:U23国足决赛首发阵容公布 媒体热议战术与应对策略

精彩评论(10)