ChatGPT高级语音模式正式上线有9种声线可选_互联网_资讯

9月25日消息，OpenAI周二宣布，ChatGPT高级语音模式（Advanced Voice Mode）正式上线，向所有付费订阅用户开放。这项功能使ChatGPT的语音更自然。

OpenAI将首先向ChatGPT的Plus和Teams客户推出，企业和教育客户将于下周获使用权限。

ChatGPT还将推出五种不同风格的新声音，用户可以试用： Arbor、Maple、Sol、Spruce 和 Vale。这使得ChatGPT的可选声音总数达到了9个，另外四种是Breeze、Juniper、Cove 和 Ember。

OpenAI还增加了自定义指令、记忆、改进的口音等新功能，ChatGPT还可以用50多种语言说， “对不起，我来晚了”。

OpenAI原计划6月底推出此功能，但因为需要更多时间来准备，推迟发布。

ChatGPT的高级语音模式能够理解并回应情绪和非语言暗示，让我们更接近与AI进行实时、自然的对话。OpenAI在5月份首次展示了GPT-4o，以及这种超现实的“高级语音模式”。

GPT-4o能在232毫秒内对音频输入做出反应，平均反应时间为320毫秒，这与人类在对话中的反应时间相近。高级语音模式不需要像当前的ChatGPT语音模式那样将语音转换为文本，再转换成语音，从而降低了交互延迟。

转载请注明出处。