OpenAI推出GPT-RealTime语音模型,加量降价创科技新局
(图片来自网络)
OpenAI今日发布为其开发者打造的语音转语音模型GPT-RealTime,并同步更新多项功能。这是OpenAI推出的最先进语音合成模型,在遵循复杂指令、精确调用工具及生成自然语音等方面大幅改进。
在功能上,GPT-RealTime具备多项优势:
- 自然朗读重复的字母、数字,无缝切换语言,甚至能捕捉笑声等非语言信号
- 新增语音Cedar和Marin,独家在Realtime API中提供
- 支持远程MCP服务器、图像输入、SIP(会话发起协议)电话呼叫等API功能
定价方面,通用版Realtime API和GPT-RealTime模型降价,GPT-RealTime每百万token音频输入价格为32美元,音频输出价格为64美元,相比旧版下调20%。同时,OpenAI增加了对话上下文细粒度控制,允许开发者设置智能token限制,降低长会话成本。
在性能改进方面,GPT-RealTime在语音质量、指令遵循等方面表现提升。例如,在Big Bench Audio基准测试中准确率达82.8%,超过旧模型;在MultiChallenge音频基准测试中得分为30.5%,大幅提升指令遵循准确性,还能处理复杂多步骤请求。
Realtime API新增功能还包括:开发者可通过远程MCP服务器URL启用支持,图像输入功能让模型能基于图片创建对话,SIP支持实现与电话网络集成等,简化开发者集成流程。
为了防止模型滥用,Realtime API设有多层安全防护,如主动分类器检测有害内容等。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月8日:三星Galaxy S27 Ultra主摄与面部识别技术曝光:受iPhone影响显现?
- 2025年11月8日:德甲第10轮:汉堡1比1多特蒙德 比赛亮点回顾
- 2025年11月8日:凯恩谈拜仁终结16连胜:赛后接受采访谈比赛与未来
- 2025年11月8日:讯飞用AI键打造市集式输入法,开启个性化表达新篇章
- 2025年11月8日:尤里奇回应与卢克曼冲突:事件解决后全队更团结
- 2025年11月8日:昨日社会热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日文化热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日科技热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日体育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日娱乐热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日财经热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日教育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日汽车热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日健康热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:杨浦滨江世界级博物馆开启‘人工智能+’技能文化新场景(开馆两周年)
- 2025年11月8日:三菱Eclipse跨界纯电汽车发布 搭载智能装甲设计 续航达600公里
- 2025年11月8日:微信集中行动:下架违规微短剧和关联小程序,守护平台清朗空间
- 2025年11月8日:美国学校部署AI监控工具 监测学生与聊天机器人对话以预防心理问题
- 2025年11月8日:医疗AI迎来“评审员”!北京启动医疗人工智能应用评测服务
- 2025年11月8日:“10后”职场变革:语音取代键盘或成趋势 研究预测语音沟通主流化

精彩评论(10)