加州理工华人研究揭示:LLM‘性格’是语言幻觉,揭露AI人格真相

(图片来自网络)
【新智元导读】最新来自加州理工与剑桥的研究颠覆想象。研究团队让大语言模型(LLM)填写“大五人格”问卷,还安排翻牌游戏、偏见测试和从众实验,结果发现模型的“自报性格”与实际行为几乎毫无关联。基于此,研究团队提出一个新概念——人格幻觉。
研究团队不仅让模型做问卷,还设计了一系列行为实验,结果令人意外:模型声称的性格,与实际行为几乎对不上。这项研究由一个跨学科团队联合完成,包含计算机背景的青年研究者,还有认知神经科学、社会学等领域的教授。
第一作者是兼具计算机与心理学双重背景的韩芃睿,合作者阵容多元,涵盖加州理工博士后、剑桥教授、认知神经科学教授等,这种跨领域合作让团队能跳出单一问卷测量,进一步检验模型真实行为。
研究团队将心理学行为实验(如翻牌游戏、偏见测试等)搬到大模型身上,检验它们在真实任务中的表现。结果发现,模型在语言上宣称自己谨慎、不随大流等,但在实际任务中却表现出相反或脱节的行为,比如声称谨慎的模型在翻牌游戏中频繁冒险,声称无偏见的模型在偏见测试中表现出隐性偏见。
研究团队对“自报特质→行为表现”的关联做了系统统计,结果发现,模型嘴上说的性格与实际行为关联极低(多数情况仅为偶然水平),规模大的模型也无法显著改善这种错位,说明“人格”多为语言层面幻象。
研究还尝试了常见的“Persona注入”方法(在提示词里强行设定人设),结果发现:这种方式仅能改变模型的语言自报性格,却无法影响其真实行为表现,反而可能引发跨特质的副作用,进一步证明“人格”是语言幻觉而非真实行为特征。
研究团队提出“人格幻觉”概念,指出大模型在语言层面能营造稳定的人设假象(如友好、稳定等),但这种稳定性仅限于自我报告,一旦落实到具体任务,假象立刻崩塌。这提醒用户不要轻信模型“自报人格”,也对AI对齐方法的作用有新认识,未来需转向“行为导向的对齐”以提升行为一致性。
参考资料:https://x.com/AnimaAnandkumar/status/1965102122376274100 https://psychology-of-ai.github.io/ https://arxiv.org/abs/2509.03730 https://github.com/psychology-of-AI/Personality-Illusion
最新新闻
- 2025年9月21日:ATP拉沃尔杯赛场:阿尔卡拉斯不敌弗里茨,世界队保持领先
- 2025年9月21日:荣耀YOYO助理新增对话学习记忆能力,智能交互体验再升级
- 2025年9月21日:华硕电竞显示器迭代升级 新增“R”后缀优化体验
- 2025年9月21日:法国媒体团探秘比亚迪总部:中国新能源车领跑者技术炼成记
- 2025年9月21日:全球首台‘超导超磁’工业母机深圳投产,中国高端磁电装备实现重大突破
- 2025年9月21日:仰望U9 Xtreme刷新全球电车极速纪录,全球限量30台车型重磅登场
- 2025年9月21日:OpenAI神秘核心人物Bob身份引发行业热议
- 2025年9月21日:华为启动‘天工计划’:投入10亿元助力鸿蒙AI生态创新
- 2025年9月21日:马斯克新模型:9折实现Gemini 2.5性能,支持2M上下文
- 2025年9月21日:制造业500强榜单发布:通信设备、半导体行业领跑增长,展现产业升级新图景
- 2025年9月21日:库里与费德勒为拉沃尔杯网球赛进行挑边 跨界嘉宾添仪式感
- 2025年9月21日:从‘提振消费’到‘扩大服务消费’,政策扩围筑牢经济增长根基
- 2025年9月21日:马斯克旗下XAI或计划融资100亿美元 马斯克回应称报道不实
- 2025年9月21日:AI录音卡市场爆发:巨头与华强北围猎,市场竞争激烈
- 2025年9月21日:企业助力 科研‘从0到1’获民间资金激活
- 2025年9月21日:卢煜明:一滴血筛肿瘤,可提前4 - 5年发现鼻咽癌
- 2025年9月21日:郑州交警曝光电动车违规行为:越线停车、闯红灯等成交通隐患
- 2025年9月21日:华为 HarmonyOS 6 开发者版本体验招募(二期)延期至 9 月 29 日
- 2025年9月21日:小米SU7系列升级后新增4K云台等生态件支持
- 2025年9月21日:忆联首款消费级 QLC SSD AE531 发布:DRAM-less + 静态 SLC 缓存创新方案
精彩评论(10)