AI人格分裂实锤!30万道送命题,撕开OpenAI、谷歌「遮羞布」
(图片来自网络)
AI“人格分裂”实锤!30万道送命题撕开大模型“遮羞布”
新智元报道发现,Anthropic联合Thinking Machines针对OpenAI、谷歌等主流大模型开展了一项极具冲击力研究:通过设计30万个“两难问题”与极限压力测试,揭开这些AI的“人设分歧”与“价值观矛盾”。
研究核心:如何科学评判大模型的“理性”?该研究通过场景测试,让AI在“赚钱”与“有良心”等冲突任务中选择,以此考察其“人格(规范、价值观)”。
- 测试结果:30万个场景中,OpenAI、谷歌、Anthropic等大模型出现分歧超7万个,显示模型规范本身存在矛盾,甚至导致AI“精神分裂”。
- 规范问题:“模型说明书”(行为准则)在冲突时,AI无所适从。研究揪出规范内部模糊或矛盾,导致模型行为差异。
- 模型差异:不同大模型“价值观优先级”迥异,如Claude侧重道德责任,Gemini强调情感深度,OpenAI与Grok偏向商业效率,分歧源于规范解释不同。
研究发现,当AI面对冲突任务时,若规范存在模糊或矛盾,就会做出不同选择,甚至违背自身“说明书”。这就像一个学生面对矛盾的规则,不知如何是好。
行业启示:模型规范需更清晰,测试体系需更严谨,才能让AI更安全、理性地辅助人类。对于普通用户来说,了解AI可能存在的分歧,也能更理性地使用其服务。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年10月26日:维修专家怒批RTX 5090公版显卡设计存严重缺陷 几乎无法修复
- 2025年10月26日:苹果M5 MacBook Pro隐形升级:SSD速度提升超两成,性能表现亮眼!
- 2025年10月26日:适老支付功能暗藏风险 老年群体遇“默认隐忧”
- 2025年10月26日:OpenAI超1.5万亿交易内幕:奥特曼核心团队主导 突破传统谈判模式
- 2025年10月26日:AMD曝光R5 7500X3D处理器:入门级Zen4架构游戏芯片引关注
- 2025年10月26日:昨日社会热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日文化热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日科技热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日体育热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日娱乐热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日财经热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日教育热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日汽车热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日健康热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:昨日历史热门资讯汇总-早报速览(2025-10-26)
- 2025年10月26日:微软终止Windows 10支持后 苹果Mac销量大幅增长成最大赢家
- 2025年10月26日:首届沿沪宁创新成果展示交易会举办 首单合作意向达800万
- 2025年10月26日:申花外援冲突引争议 英博欲追责恐遭禁赛
- 2025年10月26日:山东三支足球队中超赛场爆冷,搅乱争冠并实现保级
- 2025年10月26日:近6轮5败!国安外援直言耻辱,工体倒戈狂嘘+官微遭怒冲

精彩评论(10)