中山大学新作SpatialDreamer,复杂空间推理性能提升超55%,达行业新标杆!

2025年12月20日
news

(图片来自网络)

中山大学联合研究团队推出SpatialDreamer技术,在复杂空间推理领域实现重大突破,性能提升超55%,达到行业领先(SOTA)水平。这项研究通过模拟人类主动探索、想象与空间推理过程,解决了人工智能在空间任务中的局限,为AI空间智能发展开辟新方向。


背景方面,多模态大语言模型(MLLMs)虽然场景理解能力提升,但在需要心理模拟的复杂空间推理任务(如视角变换判断遮挡物体)表现受限。现有方法多依赖被动观察空间数据,缺乏人类特有的主动想象与动态更新内部表征能力,容易在视角变化等任务中推理失败。为解决这一问题,研究团队提出SpatialDreamer,采用强化学习框架,构建“探索-想象-推理”闭环流程。


SpatialDreamer的闭环推理流程包含三个核心步骤:


  • 探索:模型推理出最优自我中心动作(如「前进0.75米」或「左转45度」);

  • 想象:调用世界模型生成执行动作后的新视角图像;

  • 推理:整合所有累积的视觉证据,生成最终答案。


此外,研究团队提出GeoPO策略优化方法,解决长序列推理中奖励稀疏的问题。GeoPO包含树状采样、多级奖励、几何惩罚机制,在提升模型性能的同时加快训练收敛速度。同时构建SpatialDreamer-SFT数据集,包含单轮推理与反思式推理数据,引导模型学习“思考-想象-回答”的模式。


实验结果表现亮眼:在SAT、MindCube-Tiny、VSI-Bench等空间推理基准上均实现SOTA。例如MindCube-Tiny任务,较基线提升超55%,在物体计数、相对方向判断等任务中全面领先。这项技术不仅提升了推理准确率,更证明多模态大语言模型(MLLMs)可通过“想象力”增强推理能力,为人工智能发展具备类似人类空间智能开辟了重要路径。


论文参考链接:https://arxiv.org/pdf/2512.07733

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-12-20 19
    这论文的研究方法和结果很前沿,为空间智能发展开新局!
  • 网友9 2025-12-20 19
    科技发展让AI更智能,类似导航、工程等领域肯定受用,很赞!
  • 网友8 2025-12-20 19
    空间推理性能提升超55%,说明研究方向很正确,值得支持!
  • 网友7 2025-12-20 19
    SpatialDreamer的闭环流程很有趣,感觉未来AI越来越聪明了。
  • 网友6 2025-12-20 19
    AI空间推理提升对产业升级有帮助,值得关注的科技进展!
  • 网友5 2025-12-20 19
    这技术对教育、设计等领域很有用,以后学习空间知识更轻松了。
  • 网友4 2025-12-20 19
    中山大学团队合作,空间推理突破很震撼,感觉未来更便捷了!
  • 网友3 2025-12-20 19
    没想到科学这么快,AI能像人一样思考空间问题,科技发展真后悔没早生!
  • 网友2 2025-12-20 19
    SpatialDreamer技术提升55%空间推理,对AI发展帮助很大,很期待应用!
  • 网友1 2025-12-20 19
    这AI模拟人类空间推理太厉害了,未来生活肯定更智能!
查看“中山大学新作SpatialDreamer,复杂空间推理性能提升超55%,达行业新标杆!”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙