BBC等机构研究显示AI新闻总结表现差异 谷歌Gemini错误比例高于其他系统

2025年10月24日
news

(图片来自网络)

欧洲广播联盟(EBU)与BBC近期联合开展研究,评估ChatGPT、Gemini、Perplexity等多款生成式AI系统在新闻摘要方面的表现。

研究背景源于约15%的25岁以下年轻人主要通过AI获取新闻。BBC先通过大规模问卷调查、六场焦点小组访谈收集公众对AI新闻工具的使用体验与看法,随后EBU扩展至国际范围。

结果显示:约42%的英国成年人信任AI内容准确性,年轻群体信任度更高;但84%的受访者认为,若出现事实性错误,会严重削弱对AI的信任。

Gemini成“表现异类”:各模型整体表现差距不大,但谷歌Gemini错误数量最多、严重错误比例也远高于其他系统。

Gemini问题主要包括:缺乏清晰资料来源链接、难区分可靠与讽刺内容、过度依赖维基百科、语境不足、错误引用原文等。

六个月研究周期内,各系统新闻摘要准确率普遍提升,Gemini的进步尤为明显。但即便如此,Gemini的表现仍明显落后于其他系统。尽管AI新闻总结技术有进步,但其准确性仍需提升。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-10-24 08
    多项研究显示AI新闻总结存在缺陷,尤其是Gemini的表现问题值得关注,技术改进方向值得探讨。
  • 网友9 2025-10-24 08
    AI工具在新闻总结上有用,但错误风险要注意。
  • 网友8 2025-10-24 08
    AI辅助总结新闻还行,但错误得自己检查下。
  • 网友7 2025-10-24 08
    Gemini错误多,AI新闻总结技术还有提升空间,值得关注。
  • 网友6 2025-10-24 08
    用Gemini总结新闻得小心,可能出错哦。
  • 网友5 2025-10-24 08
    AI helpful,但错误让人担心,希望更准确。
  • 网友4 2025-10-24 08
    技术有进步但可靠性需加强,Gemini问题值得研究改进。
  • 网友3 2025-10-24 08
    AI现在能做新闻总结,但准确很重要,还是要多看原文。
  • 网友2 2025-10-24 08
    Gemini错误多,用AI得留心,别被误导。
  • 网友1 2025-10-24 08
    AI新闻总结不错,但错误要注意,得仔细核对!
查看“BBC等机构研究显示AI新闻总结表现差异 谷歌Gemini错误比例高于其他系统”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙