OpenAI推出新一代可对话ChatGPT语音机器人

2025-05-28 12:23 loading...

摘要 OpenAI 正在推出一款可以与之交谈的先进人工智能聊天机器人。这款机器人现已上� 。币圈网报道：

来源：量子号

OpenAI正式推出了一款全新的人工智能聊天机器人，用户可以直接与之进行语音对话。这款机器人已向部分用户开放，标志着OpenAI在开发新一代人工智能语音助手方面迈出了重要一步。

这款新型ChatGPT语音机器人不仅能够实现类似于Siri和Alexa的功能，还具备更强大的能力，可以支持自然、流畅的对话体验。它能够识别不同语调表达的情感，在对话中断时做出反应，并实时回答用户的问题。此外，该机器人的语音经过优化，听起来更加自然，能够用声音传达多种情绪。

这款语音机器人由OpenAI最新的GPT-4o模型驱动，该模型结合了语音、文本和视觉处理能力。为收集用户反馈，OpenAI最初仅向“一小部分”ChatGPT Plus付费用户推出了这一功能，但计划在今年秋季扩展至所有ChatGPT Plus订阅用户。ChatGPT Plus的订阅费用为每月20美元（约合144元人民币）。OpenAI表示，将通过ChatGPT应用程序通知首批用户，并提供使用新模型的详细说明。

这项语音功能于今年5月首次宣布，但因需要更多时间完善安全机制而推迟了一个月发布。例如，改进模型检测和拒绝不良内容的能力，同时优化其基础设施以支持数百万用户的实时响应。

为确保安全性，OpenAI与超过100名外部红队测试人员合作，这些测试人员来自29个国家，掌握45种语言，任务是探测模型可能存在的漏洞。公司还实施了多项安全措施，包括防止模型被用于制作音频深度伪造。为此，OpenAI与配音演员合作创建了四种预设声音，确保GPT-4o不会模仿或生成他人的声音。

然而，OpenAI也曾因使用一种名为“Sky”的声音而引发争议。有用户指出，该声音与女演员斯嘉丽·约翰逊的声音极为相似。对此，约翰逊发表声明称，OpenAI曾试图联系她，希望获得使用其声音的许可，但她拒绝了。尽管OpenAI否认“Sky”声音与约翰逊有关，但公司仍决定暂停使用该声音。

此外，OpenAI还面临多起涉嫌侵犯版权的诉讼。为应对这些问题，公司引入了过滤器，以识别并阻止生成音乐或其他受版权保护音频的请求。同时，OpenAI在其基于文本的模型中采用的安全机制也被应用于GPT-4o，以防止其生成违法或有害内容。

展望未来，OpenAI计划进一步扩展ChatGPT的功能，例如加入视频通话和屏幕共享等高级功能。在5月的一次演示中，员工展示了如何通过手机摄像头拍摄一张纸上的数学方程式，并让AI协助解决问题；他们还共享了电脑屏幕，要求模型帮助解决编程难题。不过，这些功能目前尚未推出，具体上线时间仍有待公布。