上海AILab推出首个大模型数据竞技场 研发数据评价体系

2025年8月24日
news

(图片来自网络)

上海人工智能实验室(AILab)推出首个大模型数据竞技场,研发出数据评价体系,正式告别“炼丹玄学”,让数据价值的量化与辨别从模糊走向科学。


一、数据竞技场的核心价值与目标



  • 解决数据“玄学”困境:过去数据价值评估缺乏科学标准,如今通过公平、公开、透明的平台,首次尝试验证数据价值,让数据质量评估从主观变为客观。

  • 构建科学评价体系:提供直观数据评测榜单、训评一体化工具、多维度评分工具,完整可复现地验证数据价值。


二、平台的具体运作与成果



  • 公平竞技平台:覆盖通用、数学、代码等多领域数据集,采用社区常用模型(如Llama3.1、Qwen等)和标准化训练配置,通过模型效果衡量数据价值,生成直观评测榜单。

  • 多维度评分工具:从数十维度对数据精细打分,已开源部分评分数据,助力后续研究。

  • 开源工具支撑:开源训评一体化、多维度评分工具,让数据价值验证可复现、可扩展。


三、解决的核心需求



  • 数据评估与筛选:帮助研究者快速识别高质量数据集,降低试错成本,赋能模型训练。

  • 数据生成优化:为数据合成提供多维度评分与工具,指导生成优质数据。

  • 数据价值洞察:助力学术研究探索数据与模型效果的关联,支撑前沿数据研究。


四、开源与未来



  • 工具与数据开源:将核心工具开源,让更多人参与数据价值验证,提升数据质量评价的公平性与科学性。

  • 未来计划:逐步扩展多模态数据验证、拓展医疗、金融等专业领域、及时更新数据竞技场。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-24 14
    这样能保证数据质量吗?以后AI训练用数据更靠谱了?
  • 网友9 2025-08-24 14
    开源工具很棒,后续可以和大家一起完善,推动数据领域进步。
  • 网友8 2025-08-24 14
    数据也能竞技?感觉像是给数据办了运动会,很有意思。
  • 网友7 2025-08-24 14
    科学化评价很重要,之前数据选得心慌,现在有工具和平台,效率提升不少。
  • 网友6 2025-08-24 14
    终于不用猜数据好坏啦,竞技场榜单一查就明白,超方便!
  • 网友5 2025-08-24 14
    数据竞技场是什么?可以通过这个让AI用数据更准确吗?
  • 网友4 2025-08-24 14
    多维度评分工具很实用,为数据质量研究提供了客观依据,推进了学科发展。
  • 网友3 2025-08-24 14
    原来数据也能‘竞技’?现在AI发展太快,连数据都要比个高下,有意思!
  • 网友2 2025-08-24 14
    终于有科学方法评估数据价值了,之前靠经验确实麻烦,这个竞技场太需要了。
  • 网友1 2025-08-24 14
    这个数据竞技场好酷,以后数据选起来有标准了,再也不用靠‘玄学’了!
查看“上海AILab推出首个大模型数据竞技场 研发数据评价体系”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙