清华学者解析数据标注与AI发展关系:高质量数据集和人工智能双向驱动

2025年8月29日
news

(图片来自网络)

清华大学张小劲教授解析数据标注与人工智能发展关系:高质量数据集和人工智能产业双向驱动


随着人工智能技术的飞速发展,数据标注产业处于新的历史发展阶段,面临着前所未有的机遇与挑战。在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,清华大学数字政府与治理研究院院长张小劲教授深入探讨了数据标注产业的发展现状、面临挑战以及未来发展方向。


核心观点



  • 高质量数据集与人工智能发展相互驱动,数据标注产业发展进入新阶段,行业逐渐成熟。

  • 传统人工标注竞争激烈且面临变革,大模型将推动标注模式优化,智能检测和工具优化成为长远发展方向。

  • 合成数据领域发展值得关注,能补足真实数据有限的不足。


张小劲教授指出,数据标注产业发展已进入新战略阶段,行业逐步完善,数据标注企业功能与职责明确,整个行业逐渐走向成熟。这一阶段标志着数智化时代的到来,同时也催生了新的职业和职业技能标准。


从用工需求来看,数据标注行业处于引领发展的位置。最初用工需求集中在人工成本较低的地区,但随着优质数据集的出现,用工需求逐渐向经济发达地区和人工智能前沿领域转移。部分人力资本丰富的地区(如河南、四川)也呈现出活跃的发展态势,反映了地域分布的总体趋势。


在行业分布方面,数据标注行业主要集中在信息技术和科学研究相关行业。其中,人工智能先导研究行业的用工需求更为旺盛,对数据标注的重视程度也更高,而一般化企业则较少涉足。


传统人工标注模式面临根本变革。传统人工标注竞争激烈且内卷化,用工需求规模大,但用工流动性也较大。张小劲特别指出,未来大模型将带动标注工作,尤其是海量数据的标注,智能检测和工具优化将成为下一阶段长远的发展方向。


未来合成数据领域的发展尤为值得关注。由于真实世界的数据有限,标注过程辛苦且成本高昂;而通过新型人工智能的数据搭接,合成数据领域将逐渐适应发展需求。


数据标注企业分类方面,通过2×2矩阵(场景强度与基础强度)可划分为双强、双弱、偏强、偏弱四种趋势。不同类型企业(如具身机器人行业、大型产业与企业、国外垂直场景团队、外包众包团队等)各有特点。


针对数据标注产业发展,张小劲提出五项对策建议:推进AI辅助标注与全自动化标注技术演进、建立多轮质检与反馈机制、开发行业针对性标注系统、深化校企合作、强化技能培训。这些举措将推动数据标注产业高质量发展,助力人工智能与高质量数据集的双向驱动。


(来源:南都N视频 记者黄莉玲 李玲 发自贵阳)

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-29 15
    听到张小劲教授的解读,对数据标注和AI的关系有了更清晰认识,很受启发。
  • 网友9 2025-08-29 15
    数据标注与AI双向驱动,行业成熟了,新职业和技能标准也来了。
  • 网友8 2025-08-29 15
    合成数据补足真实数据不足,这种发展很智能,科技越来越方便了。
  • 网友7 2025-08-29 15
    数据标注产业新阶段,企业分类和对策很务实,有助于判断发展方向。
  • 网友6 2025-08-29 15
    传统人工标注变革是大趋势,大模型带动标注更高效,感觉很实用。
  • 网友5 2025-08-29 15
    作为学生,觉得数据标注和AI联系这么紧密,未来科技发展会很精彩。
  • 网友4 2025-08-29 15
    张小劲教授分析很专业,数据标注与AI的关系研究得很深入,对策有针对性。
  • 网友3 2025-08-29 15
    数据标注和AI双向驱动,合成数据真有意思,希望行业越来越好!
  • 网友2 2025-08-29 15
    数据标注产业新阶段,大模型推动变革,得跟上科技发展节奏。
  • 网友1 2025-08-29 15
    这个观点很有见地,数据标注和AI确实相互促进,感觉未来很有潜力!
查看“清华学者解析数据标注与AI发展关系:高质量数据集和人工智能双向驱动”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙