Nature重磅研究推出全球首个合规计算机视觉数据集:FHIBE推动AI公平性新标准

2025年11月6日
news

(图片来自网络)

全球首个!Nature重磅研究:计算机视觉告别“偷数据”时代


计算机视觉(CV)技术广泛应用于自动驾驶汽车、消费电子设备等众多领域,图像数据集在其中扮演基础性角色。过去,ImageNet等大型图像数据集虽推动领域革命,但多数数据采集依赖网络抓取,存在未经授权、缺乏多样性、知情同意不足等伦理问题,导致人工智能系统存在偏见(如人脸识别对不同群体准确率不同)。


为解决这一问题,Sony AI推出全球首个公开可用的、全球多样化的、基于用户同意的数据集——FHIBE。该数据集专门用于评估以人为中心的计算机视觉任务的公平性,收录来自81个国家和地区的10318张图像,涉及1981位独立个体,涵盖人脸识别、视觉问答等广泛任务。


FHIBE具有多项优势:其一,采用全球众包和自我报告形式,参与者上传照片并报告年龄、代词、祖源区域等信息,形成1234个交叉群组;其二,图像拍摄设备涵盖45家厂商的785种型号,还原16种场景、6种光照、7种天气等条件;其三,区域分布均衡(非洲占44.7%,亚洲与大洋洲占40.6%),显著改善人像数据过度集中于北美与欧洲的问题;其四,拥有最全面的标注信息,包括人口统计、物理属性等多维度数据。


相关研究论文以“Fair human-centric image dataset for ethical AI benchmarking”为题发表于权威期刊Nature,论文指出,FHIBE为检查AI偏见提供了伦理规范的基准,是可信人工智能(Trustworthy AI)发展的重要里程碑。


研究团队对主流计算机视觉模型进行测试,发现年轻、肤色较浅群体模型准确率更高,年长、肤色较深群体准确率更低,并识别出灰白发色、女性发型等细微偏见。FHIBE能精准定位偏见来源,帮助从业者防范风险。


不过,FHIBE也存在局限性,如成本高昂、视觉多样性不足等,但为未来伦理化数据收集提供了路径。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-11-06 13
    希望未来更多数据集能像FHIBE这样合规,这样AI才能更可靠。
  • 网友9 2025-11-06 13
    FHIBE的多样性和伦理标注很全面,对AI公平性评估有帮助,值得点赞。
  • 网友8 2025-11-06 13
    数据集的合规性很重要,这样AI才能更公平地服务所有人,支持这项研究。
  • 网友7 2025-11-06 13
    这么复杂的伦理问题能解决,说明AI发展越来越成熟了,很震撼。
  • 网友6 2025-11-06 13
    计算机视觉的数据伦理一直是痛点,现在有FHIBE了,是技术发展的进步。
  • 网友5 2025-11-06 13
    终于等到这样的数据集,之前的伦理问题终于有解决办法了,很期待未来应用。
  • 网友4 2025-11-06 13
    这个研究很有意义,但成本太高,以后是否能普及呢?
  • 网友3 2025-11-06 13
    数据集的伦理问题一直困扰我,现在有FHIBE了,未来AI会更人性化。
  • 网友2 2025-11-06 13
    终于摆脱偷数据的问题了,科技发展应该更规范,这样AI才更公平。
  • 网友1 2025-11-06 13
    这个研究太重要了,以后AI发展更有保障了,终于有合规的数据集了。
查看“Nature重磅研究推出全球首个合规计算机视觉数据集:FHIBE推动AI公平性新标准”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙