谷歌研究:大模型推理智能的‘多角色对话’机制揭秘
(图片来自网络)
近年来,大模型推理能力迎来显著跃迁,谷歌、芝加哥大学等机构的一项研究为该能力提升的原理提供了新解:推理模型并非仅靠“多算几步”,而是内部模拟了类似人类的“多角色对话”互动机制,这种“思维社会”结构助力增强推理效果。
研究指出,推理过程并非单调思考,而是像模拟辩论队一样,模型会争论、纠正观点、表达惊讶并调和冲突,最终得出正确答案。通过对DeepSeek - R1等推理模型推理轨迹的详细分析,发现其视角多样性更高,会激活更广泛的与人格和专业知识相关的特征,并在这些特征间产生充分冲突。
研究采用的方法丰富多样,包括:
- 识别四类对话行为:问答行为、视角转换、观点冲突、观点调和,统计这些行为出现的频率;
- 分析社会情感角色,依据Bales互动过程分析框架,统计12类互动角色(如信息给予、信息征询、积极情感等)的出现情况;
- 识别四类认知行为(结果核验、路径回溯、子目标拆解、逆向推理),评估其对推理准确率的影响;
- 通过稀疏自编码器调控特定特征(如表达惊讶、认同的话语标记),探究会话行为的作用。
实验结果展现,与基线模型和仅指令微调的模型相比,DeepSeek - R1和QwQ - 32B等推理模型,在推理过程中展现出更高频率的对话式行为和社会情感角色。例如,在解决研究生水平的科学推理任务时,DeepSeek - R1会通过“不同意”“提出建议”等社会情绪角色展开对话;而在简单任务中,对话行为则相对有限。
进一步强化学习实验表明,当仅以推理准确率作为奖励信号时,基础模型会自发增加对话式行为;引入对话式脚手架后,模型推理能力提升更显著。这表明,模拟多角色内部对话的“思维社会”机制,能有效提升大模型的推理表现。
谷歌由此提出“通过智能体组织形式系统性利用群体智慧”的新研究方向,该研究也为理解大模型推理能力本质提供了新视角。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月26日:马化腾提及元宝春节分10亿现金红包 望重现微信红包盛况
- 2026年1月26日:理想汽车宣布战略转向具身智能,品牌定位再定义!
- 2026年1月26日:天津加速脑机接口与人工智能发展,代表委员献计献策
- 2026年1月26日:U23国足队员李昊赛后谈亚锦赛:激动迎球迷接机,直言决赛失利无‘虽败犹荣’
- 2026年1月26日:U23国足载誉归国 千球迷机场接机 李昊成粉丝最爱
- 2026年1月26日:莱切特加盟深圳新鹏城,双方完成签约
- 2026年1月26日:大国院士:80岁追光科技,目标不凡
- 2026年1月26日:挪威学者点赞中国四大全球倡议引领国际秩序向公正方向发展
- 2026年1月26日:税收数据展现2025年中国消费新态势
- 2026年1月26日:外资机构看好2026年中国经济 加码布局中国资产(视频)
- 2026年1月26日:[好评中国]“春暖农民工”服务行动启动 托举3亿人稳稳幸福
- 2026年1月26日:希望的田野丰收可期,奋斗绘就新图景
- 2026年1月26日:破圈出海:中国品牌加速登陆全球市场
- 2026年1月26日:南方小城冰雪装备创新,硬核滑雪杖助力冰雪运动发展
- 2026年1月26日:C919生产开门红,年内有望每15天产一架
- 2026年1月26日:开源版‘贾维斯’引发Mac mini热销 量子位探秘AI新玩法
- 2026年1月26日:Windows 1月更新翻车:卸载也出错,微软建议谨慎操作
- 2026年1月26日:U23国足归国球迷发放国旗迎接,为将士营造回家氛围
- 2026年1月26日:数看上海2025外贸韧性:进出口、出口、进口均创历史新高
- 2026年1月26日:延安与遵义高铁直达,革命老区互联新时代开启

精彩评论(10)