港中深团队突破:解决AI语音助手“答非所问”难题

(图片来自网络)
香港中文大学(深圳)的研究团队最近取得重大突破,成功解决了AI语音助手“答非所问”的难题,为语音交互技术发展打开了新局面。
当前很多AI语音助手存在一个突出问题:当用户用自然语言提问时,助手往往给出与意图不相关甚至偏离的回答,类似“鸡同鸭讲”的沟通困境。团队研究发现,这是由于语音大语言模型在训练时存在“声学表示和语义表示不匹配”的鸿沟,导致理解与回应脱节。
为解决这一问题,研究团队提出了创新方案EchoX,采用“回声训练”技术,将声学处理与语义理解分离,分三阶段训练:
- 第一阶段:让系统理解语音并生成对应文本,如同“听懂后转文字”;
- 第二阶段:将文本内容转换成自然语音,实现“文字转声音”;
- 第三阶段:通过“回声训练”确保语音输出准确反映语义理解,如同“基于理解再回应”。
经过实验验证,EchoX在知识型问答等场景中表现显著提升。使用少量训练数据(约6000小时)就能达到传统系统数百万小时数据的性能,且回答更贴合用户意图。此外,它还解决了语音信息长序列处理、流式生成等技术难题,让语音交互更自然流畅。
研究团队开源发布该系统,为行业技术迭代提供了新的方向,有望推动语音AI助手向更智能、更贴合用户需求的阶段发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月13日:2025外滩大会热议AI时代人才发展:人机共融新方向
- 2025年9月13日:交大与字节跳动联合突破 强化学习训练速度提升2.6倍 攻克‘最慢一环’
- 2025年9月13日:科技大厂掀起AI智能体竞赛热潮 梁文峰带队推动技术创新
- 2025年9月13日:科学家发现黑洞合并新证据 宇宙深处或存在第三颗致密天体
- 2025年9月13日:奥迪RS6 e-tron纯电旅行车原型现身纽北,曾传计划搁浅现重新曝光
- 2025年9月13日:雷军回应黑公关:小米法务部今年已取证数百个账号
- 2025年9月13日:顺丰无人驾驶车亮相服贸会,以AI技术筑牢全球供应链防线
- 2025年9月13日:巴基斯坦总统出席国际文化论坛:以艺术为桥梁架起文明纽带
- 2025年9月13日:志愿军老兵高唱《我的祖国》迎接烈士遗骸回归
- 2025年9月13日:第二届金熊猫奖举行,以光影为桥 共赏文明之美
- 2025年9月13日:英魂归故里 12响最高鸣枪礼节致敬志愿军烈士
- 2025年9月13日:美媒发声:买中国货利国安 贸易保护受质疑
- 2025年9月13日:走进民企看“质”变|民企硬核科技迈向全球:高端医疗与工业软件发展
- 2025年9月13日:奇瑞威麟以“油电平权”挑战全球皮卡产业规则
- 2025年9月13日:前谷歌X团队成立AI原生影视工作室 拟冲击戛纳电影节
- 2025年9月13日:工信部等八部门有条件批准L3级智能网联汽车生产准入
- 2025年9月13日:马斯克公开力挺AMD:中小型AI模型领域表现获认可
- 2025年9月13日:苹果A19 Pro刷新苹果A系列芯片单核GeekBench跑分纪录
- 2025年9月13日:「创新场景50」年度最佳AI应用场景TOP 15榜单重磅发布
- 2025年9月13日:2025年全国主流媒体看常州:机器人之城崛起,全场景智造进阶
精彩评论(10)