明略科技Mano大模型双榜SOTA,开启GUI智能操作新时代

2025年9月22日
news

(图片来自网络)

明略科技的专有 GUI 大模型 Mano 在行业内知名的 Mind2WebOSWorld 两大基准测试中,均取得了创纪录的 SOTA(当前最先进) 成绩,为 GUI 智能体领域带来可扩展、可持续进化的新范式,开启 GUI 智能操作新时代!


在网页端 Mind2Web 测试中,Mano 展现出「看得准、做得成」的核心优势。Mind2Web 覆盖 137 个网站、2350+ 真实任务,从填写表格到订机票、在线购物等任务一应俱全,旨在考察智能体能否在复杂多变的 DOM 结构里精准找到目标元素,并完成整个操作链。技术报告显示,Mano 在元素精度(Ele.Acc)和步骤成功率(Step SR)等指标上遥遥领先,表明其在准确识别和执行多步任务的能力上达到了新高度。


更严峻的挑战来自桌面端。OSWorld-Verified 涵盖 369 个跨应用任务,覆盖 10 类应用(如浏览器、办公软件等),每一个操作都和真实桌面场景无缝对接,被认为是桌面智能体测评界的「珠峰」。在 OSWorld-Verified 榜单的 Foundation E2E GUI & Specialized Model 评测中,Mano 直接将成功率拉至 41.6%,超过 qwen、GUI-Owl 等模型,成为通用 GUI 智能体新范式。


Mano 取得双榜 SOTA 的核心创新为两大技术:领域首创的在线强化学习训练数据自动采集的「探索器」


其一:在线强化学习 领域创新。Mano 首次提出在线强化学习训练范式,通过在真实交互环境中持续探索、优化,弥补离线训练数据单一问题。团队构建模拟环境池,让模型与真实环境交互,采用在线采样 + 离线过滤方式,动态调节任务难度,提升模型在真实操作系统的灵活性和适应性。消融实验显示,加入在线强化学习后,模型在 OSWorld-Verified 数据集上平均分数提升显著,相比离线强化学习模型结果提升 7.9,达到 41.6%。


其二:训练数据自动采集的「探索器」。Mano 设计可扩展虚拟环境集群,结合大语言模型自动生成目标清单、过滤低频功能,定制 Chrome 插件获取网页交互元素,采用 A11y Tree 等方法覆盖桌面环境交互元素,通过智能探索和轨迹评估机制,自动采集高质量交互轨迹数据,为模型训练提供数据支撑,提升数据采集效率和准确性。


这项技术突破背后是明略科技多年技术积淀。从知识图谱构建、多模态大模型研发到商业数据分析智能体 DeepMiner 等项目,为 Mano 提供了坚实的技术支撑。未来,明略科技将进一步优化 Mano 在数据采集、训练推理整合、验证码处理等领域,推动其在真实应用和端侧部署优化,助力企业智能化转型。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-22 10
    这对教育信息化、教学辅助有积极作用,智能操作能让学生更高效完成任务,科技助力教育进步。
  • 网友9 2025-09-22 10
    以后电脑能自己“动手”操作了,Mano成精咯?不过这是好事,智能操作太方便啦!
  • 网友8 2025-09-22 10
    从技术细节看,在线强化学习和数据采集解决了 GUI 智能体训练难点,提升成功率,行业推动力强。
  • 网友7 2025-09-22 10
    Mano模型太厉害了,电脑操作变得超简单,以后解锁新技能,科技让生活更方便,开心~
  • 网友6 2025-09-22 10
    明略科技的这款大模型让电脑操作更智能,以后很多重复操作能交给它,提升效率,很实用的技术。
  • 网友5 2025-09-22 10
    在线强化学习和数据自动采集技术有突破性,提升 GUI 智能体复杂场景表现,很期待。
  • 网友4 2025-09-22 10
    大模型能帮我们操作电脑、网页,以后不用自己手动点,省事多了,科技好。
  • 网友3 2025-09-22 10
    哇,Mano太厉害了,以后用电脑智能操作,再也不用手动点来点去,轻松好多!
  • 网友2 2025-09-22 10
    明略科技的技术创新很亮眼,在线强化学习和数据采集确实能解决桌面操作难题,提升办公效率。
  • 网友1 2025-09-22 10
    这个大模型让电脑操作更简单,以后不用手动点,方便很多,科技发展真好~
查看“明略科技Mano大模型双榜SOTA,开启GUI智能操作新时代”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙