人类读指针式时钟准确率超89%!顶尖AI仅13.3%,视觉推理差距显著

2025年9月14日
news

(图片来自网络)

IT之家9月14日消息,一项新研究揭示,人类读取指针式时钟的准确率可达89.1%,而目前最优秀的人工智能(AI)模型准确率仅为13.3%,该结果清晰展现出当前语言模型在视觉推理能力方面与人类存在显著差距。

阿莱克·萨法尔(Alek Safar)推出的“ClockBench”测试中,将11个大型语言模型与5名人类展开对比,该测试包含180个定制指针式时钟和720道测试题,遵循“人类易操作、AI难突破”的设计逻辑,从零构建数据集以确保公平性。

数据集包含36种独特钟面设计,涵盖罗马数字与阿拉伯数字、不同朝向、时针标识、镜像布局及彩色背景等元素,每种设计制作5个时钟,共180个。测试围绕读取时间、时间计算等问题展开,结果显示谷歌Gemini 2.5 Pro准确率13.3%、GPT-5为8.4%,表现最佳的AI仍与人类存在明显差距。

研究还发现,AI在处理罗马数字、彩色背景等钟面时准确率较低,且读取时钟的核心挑战在于从视觉信息中提取时间,而非数学运算,这为人工智能视觉推理能力提升提供了方向。萨法尔认为,AI与人类在视觉推理上的差距,既源于罕见钟面设计在训练数据中出现的频率低,也因将钟面视觉信息转化为文字描述对当前AI模型而言是一大难题。

ClockBench作为长期基准测试,其完整数据集暂保密以避免训练数据污染,但AI在视觉任务上的差距也反映出技术突破需创新路径,而非单纯扩大规模。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-14 16
    人类读时钟准确率高,是本能还是训练?AI要学习这种能力,很有必要。
  • 网友9 2025-09-14 16
    研究过程严谨,结果可信,感觉AI还有很长的路要走在小任务上。
  • 网友8 2025-09-14 16
    AI在视觉推理上的差距确实大,得从基础模型结构和方法上改进。
  • 网友7 2025-09-14 16
    新测试很创新,能暴露AI不足,希望以后有进步,缩小和人类的差距。
  • 网友6 2025-09-14 16
    这个发现对日常生活很有帮助,AI要提高这项能力,才能更好地服务人类。
  • 网友5 2025-09-14 16
    人类读时钟准确率高,说明视觉认知能力很强,AI要学习这种直观判断。
  • 网友4 2025-09-14 16
    研究数据详细,测试很严谨,结果能看出AI和人类的差距,需要新方法突破。
  • 网友3 2025-09-14 16
    对比后才知道AI在基础视觉上的短板,以后得专门做这类任务训练吧。
  • 网友2 2025-09-14 16
    没想到指针时钟对AI这么难,人类读起来好自然,感觉AI还要多练视觉推理~
  • 网友1 2025-09-14 16
    这个研究很有意义,AI在简单视觉任务上和人差距这么大,得加油提升视觉能力!
查看“人类读指针式时钟准确率超89%!顶尖AI仅13.3%,视觉推理差距显著”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙