东北大学突破文本人物搜索技术:让机器像人一样'看懂'人物描述

2025年9月13日
news

(图片来自网络)

在人工智能快速发展的当下,让计算机通过文字描述找到特定人物看似简单,实则极具挑战。东北大学郑天陆、张逸凡等研究员与华南理工大学、深瞳科技联合完成的研究,为这一技术难题提供了全新解决方案。


研究团队研发了GA-DMS(梯度注意力引导的双重掩蔽协同框架),并构建了包含500万张高质量人物图像的WebPerson数据集。以下是这项技术创新的关键亮点:



  • 数据集创新:从海量网络图片中筛选出500万张高质量人物图像,并利用AI生成详细描述,解决了传统数据集规模小、描述不准确的问题。

  • 算法突破:GA-DMS框架引入梯度注意力相似性评分机制,能智能识别文字描述中的关键信息,过滤干扰词汇,有效提升检索准确性。

  • 应用价值:在安防监控、人员搜寻、智能零售等领域展现出广泛应用潜力,将大幅提升相关场景下的人物识别效率。


这项技术不仅突破了人工智能领域的关键技术瓶颈,更推动了计算机对人类语言描述的理解能力发展,为未来智能化生活提供了有力技术支撑。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-13 15
    普通用户角度,以后找照片再也不会迷茫了,描述就能找到,方便又省时间!
  • 网友9 2025-09-13 15
    从学术角度看,算法的创新点和实验验证很扎实,为后续研究提供了重要参考。
  • 网友8 2025-09-13 15
    这项技术对安防监控等领域很有价值,能提升搜寻效率,很实用!
  • 网友7 2025-09-13 15
    机器能像人一样理解描述了,以后找照片就像玩游戏一样简单,科技发展得太神奇了!
  • 网友6 2025-09-13 15
    这解决了文字描述与图像匹配的难题,为各个领域的智能应用提供了新思路。
  • 网友5 2025-09-13 15
    以后用手机找熟人照片的时候,方便太多了,描述就能找到对应人物,太方便了!
  • 网友4 2025-09-13 15
    作为科技爱好者,GA-DMS框架的创新和大数据集构建很前沿,值得肯定!
  • 网友3 2025-09-13 15
    从学习角度来说,理解文字到图像检索的技术突破,对未来图像识别课程很有帮助。
  • 网友2 2025-09-13 15
    计算机现在能像人一样理解描述了,以后找老照片方便多了,这样的创新很实用!
  • 网友1 2025-09-13 15
    这技术太厉害了!以后找照片不用逐个找了,靠文字描述就能精准定位,科技发展得太快了。
查看“东北大学突破文本人物搜索技术:让机器像人一样'看懂'人物描述”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙