9月25日消息,OpenAI周二宣布,ChatGPT高级语音模式(Advanced Voice Mode)正式上线,向所有付费订阅用户开放。这项功能使ChatGPT的语音更自然。
OpenAI将首先向ChatGPT的Plus和Teams客户推出,企业和教育客户将于下周获使用权限。
ChatGPT还将推出五种不同风格的新声音,用户可以试用: Arbor、Maple、Sol、Spruce 和 Vale。这使得ChatGPT的可选声音总数达到了9个,另外四种是Breeze、Juniper、Cove 和 Ember。
OpenAI还增加了自定义指令、记忆、改进的口音等新功能,ChatGPT还可以用50多种语言说, “对不起,我来晚了”。
OpenAI原计划6月底推出此功能,但因为需要更多时间来准备,推迟发布。
ChatGPT的高级语音模式能够理解并回应情绪和非语言暗示,让我们更接近与AI进行实时、自然的对话。OpenAI在5月份首次展示了GPT-4o,以及这种超现实的“高级语音模式”。
GPT-4o能在232毫秒内对音频输入做出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。高级语音模式不需要像当前的ChatGPT语音模式那样将语音转换为文本,再转换成语音,从而降低了交互延迟。
转载请注明出处。