清华学者解析数据标注与AI发展关系:高质量数据集和人工智能双向驱动
(图片来自网络)
清华大学张小劲教授解析数据标注与人工智能发展关系:高质量数据集和人工智能产业双向驱动
随着人工智能技术的飞速发展,数据标注产业处于新的历史发展阶段,面临着前所未有的机遇与挑战。在2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,清华大学数字政府与治理研究院院长张小劲教授深入探讨了数据标注产业的发展现状、面临挑战以及未来发展方向。
核心观点:
- 高质量数据集与人工智能发展相互驱动,数据标注产业发展进入新阶段,行业逐渐成熟。
- 传统人工标注竞争激烈且面临变革,大模型将推动标注模式优化,智能检测和工具优化成为长远发展方向。
- 合成数据领域发展值得关注,能补足真实数据有限的不足。
张小劲教授指出,数据标注产业发展已进入新战略阶段,行业逐步完善,数据标注企业功能与职责明确,整个行业逐渐走向成熟。这一阶段标志着数智化时代的到来,同时也催生了新的职业和职业技能标准。
从用工需求来看,数据标注行业处于引领发展的位置。最初用工需求集中在人工成本较低的地区,但随着优质数据集的出现,用工需求逐渐向经济发达地区和人工智能前沿领域转移。部分人力资本丰富的地区(如河南、四川)也呈现出活跃的发展态势,反映了地域分布的总体趋势。
在行业分布方面,数据标注行业主要集中在信息技术和科学研究相关行业。其中,人工智能先导研究行业的用工需求更为旺盛,对数据标注的重视程度也更高,而一般化企业则较少涉足。
传统人工标注模式面临根本变革。传统人工标注竞争激烈且内卷化,用工需求规模大,但用工流动性也较大。张小劲特别指出,未来大模型将带动标注工作,尤其是海量数据的标注,智能检测和工具优化将成为下一阶段长远的发展方向。
未来合成数据领域的发展尤为值得关注。由于真实世界的数据有限,标注过程辛苦且成本高昂;而通过新型人工智能的数据搭接,合成数据领域将逐渐适应发展需求。
数据标注企业分类方面,通过2×2矩阵(场景强度与基础强度)可划分为双强、双弱、偏强、偏弱四种趋势。不同类型企业(如具身机器人行业、大型产业与企业、国外垂直场景团队、外包众包团队等)各有特点。
针对数据标注产业发展,张小劲提出五项对策建议:推进AI辅助标注与全自动化标注技术演进、建立多轮质检与反馈机制、开发行业针对性标注系统、深化校企合作、强化技能培训。这些举措将推动数据标注产业高质量发展,助力人工智能与高质量数据集的双向驱动。
(来源:南都N视频 记者黄莉玲 李玲 发自贵阳)
最新新闻
- 2025年11月8日:讯飞用AI键打造市集式输入法,开启个性化表达新篇章
- 2025年11月8日:尤里奇回应与卢克曼冲突:事件解决后全队更团结
- 2025年11月8日:昨日社会热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日文化热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日科技热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日体育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日娱乐热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日财经热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日教育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日汽车热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日健康热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:杨浦滨江世界级博物馆开启‘人工智能+’技能文化新场景(开馆两周年)
- 2025年11月8日:三菱Eclipse跨界纯电汽车发布 搭载智能装甲设计 续航达600公里
- 2025年11月8日:微信集中行动:下架违规微短剧和关联小程序,守护平台清朗空间
- 2025年11月8日:美国学校部署AI监控工具 监测学生与聊天机器人对话以预防心理问题
- 2025年11月8日:医疗AI迎来“评审员”!北京启动医疗人工智能应用评测服务
- 2025年11月8日:“10后”职场变革:语音取代键盘或成趋势 研究预测语音沟通主流化
- 2025年11月8日:三星Galaxy S26标准版手机线稿曝光:6.9mm厚度 或成轻薄新标杆
- 2025年11月8日:英超焦点战:曼联2-2绝平热刺 末段绝杀成焦点
- 2025年11月8日:芝加哥大学团队发明「温度调节术」:让AI学会循序渐进思考问题

精彩评论(10)