OpenAI推出GPT-RealTime语音模型,加量降价创科技新局

2025年8月29日
news

(图片来自网络)

OpenAI今日发布为其开发者打造的语音转语音模型GPT-RealTime,并同步更新多项功能。这是OpenAI推出的最先进语音合成模型,在遵循复杂指令、精确调用工具及生成自然语音等方面大幅改进。


在功能上,GPT-RealTime具备多项优势:


  • 自然朗读重复的字母、数字,无缝切换语言,甚至能捕捉笑声等非语言信号

  • 新增语音Cedar和Marin,独家在Realtime API中提供

  • 支持远程MCP服务器、图像输入、SIP(会话发起协议)电话呼叫等API功能


定价方面,通用版Realtime API和GPT-RealTime模型降价,GPT-RealTime每百万token音频输入价格为32美元,音频输出价格为64美元,相比旧版下调20%。同时,OpenAI增加了对话上下文细粒度控制,允许开发者设置智能token限制,降低长会话成本。


在性能改进方面,GPT-RealTime在语音质量、指令遵循等方面表现提升。例如,在Big Bench Audio基准测试中准确率达82.8%,超过旧模型;在MultiChallenge音频基准测试中得分为30.5%,大幅提升指令遵循准确性,还能处理复杂多步骤请求。


Realtime API新增功能还包括:开发者可通过远程MCP服务器URL启用支持,图像输入功能让模型能基于图片创建对话,SIP支持实现与电话网络集成等,简化开发者集成流程。


为了防止模型滥用,Realtime API设有多层安全防护,如主动分类器检测有害内容等。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-29 16
    OpenAI这波发布很重要,推动语音技术发展,值得期待。
  • 网友9 2025-08-29 16
    模型语音越来越自然,笑声都能模仿,体验变好。
  • 网友8 2025-08-29 16
    语音转语音做得好,成本也控制了,以后开发更方便。
  • 网友7 2025-08-29 16
    GPT-RealTime很先进,功能丰富,对语音应用有帮助。
  • 网友6 2025-08-29 16
    语音自然度提升,非语言信号也能捕捉,未来应用场景广。
  • 网友5 2025-08-29 16
    模型改进挺多的,定价下调很实惠,开发者能受益。
  • 网友4 2025-08-29 16
    科技发展太快,语音模型越来越智能,期待更多功能。
  • 网友3 2025-08-29 16
    语音合成进步明显,以后喊 call 更方便了,价格也合理。
  • 网友2 2025-08-29 16
    OpenAI这波升级厉害,语音越来越像真人了,技术进步快。
  • 网友1 2025-08-29 16
    这个语音模型很棒,说话自然,以后和AI聊天更舒服了。
查看“OpenAI推出GPT-RealTime语音模型,加量降价创科技新局”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙