BBC等机构研究显示AI新闻总结表现差异 谷歌Gemini错误比例高于其他系统
(图片来自网络)
欧洲广播联盟(EBU)与BBC近期联合开展研究,评估ChatGPT、Gemini、Perplexity等多款生成式AI系统在新闻摘要方面的表现。
研究背景源于约15%的25岁以下年轻人主要通过AI获取新闻。BBC先通过大规模问卷调查、六场焦点小组访谈收集公众对AI新闻工具的使用体验与看法,随后EBU扩展至国际范围。
结果显示:约42%的英国成年人信任AI内容准确性,年轻群体信任度更高;但84%的受访者认为,若出现事实性错误,会严重削弱对AI的信任。
Gemini成“表现异类”:各模型整体表现差距不大,但谷歌Gemini错误数量最多、严重错误比例也远高于其他系统。
Gemini问题主要包括:缺乏清晰资料来源链接、难区分可靠与讽刺内容、过度依赖维基百科、语境不足、错误引用原文等。
六个月研究周期内,各系统新闻摘要准确率普遍提升,Gemini的进步尤为明显。但即便如此,Gemini的表现仍明显落后于其他系统。尽管AI新闻总结技术有进步,但其准确性仍需提升。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年10月24日:淘宝出海双11首推跨境家具直邮服务 多市场直邮有保障
- 2025年10月24日:英特尔三季度财报公布:营收达137亿美元 同比增长3%
- 2025年10月24日:莫言手书新诗悼念杨振宁先生:以短句寄托哀思,未来或再写长文
- 2025年10月24日:未来10年将再造一个中国高技术产业:新兴产业与未来产业成核心增长极
- 2025年10月24日:杨振宁先生遗体告别仪式现场:人群排成长队,多人自带挽联书法悼念
- 2025年10月24日:奇瑞发布可变形多功能SUV概念车 计划明年Q3量产
- 2025年10月24日:微软AI负责人表态不开发成人模式AI服务,与OpenAI划清界限
- 2025年10月24日:独家|三大外卖平台被市场监管总局上门调查——监管聚焦行业规范
- 2025年10月24日:李成儒家庭变故事件:早年贫困到成功,婚姻选择引发社会关注
- 2025年10月24日:巩俐前夫黄和祥:圈外打工人身份,75岁在新加坡养老有儿女陪伴
- 2025年10月24日:央视点名!5位艺人立场争议事件引发社会热议
- 2025年10月24日:47岁杨丽娟现状曝光:曾为追星家破人亡,如今在超市打工仍未婚
- 2025年10月24日:全新MG4、极狐T1和缤果S上市后销量情况如何?
- 2025年10月24日:长安Lumin宝藏版10月30日上市 配置升级亮点多
- 2025年10月24日:丰田中国调整销售模式为‘单城单店’仅少数地区试点
- 2025年10月24日:乐道破十万吨量产,能否成蔚来翻盘关键?
- 2025年10月24日:宝马iX3 M性能版谍照曝光 或将于2027年上市
- 2025年10月24日:雷霆双加时险胜步行者 亚历山大55+8创纪录 马瑟林36+11助溃步行者
- 2025年10月24日:汇聚“她力量” 共绘全球妇女合作新图景
- 2025年10月24日:资源、经济、生态共同书写‘十四五’高质量答卷

精彩评论(10)