OpenAI推出新一代可对话ChatGPT语音机器人
2025-05-28 12:23 loading...
来源:量子号
OpenAI正式推出了一款全新的人工智能聊天机器人,用户可以直接与之进行语音对话。这款机器人已向部分用户开放,标志着OpenAI在开发新一代人工智能语音助手方面迈出了重要一步。
这款新型ChatGPT语音机器人不仅能够实现类似于Siri和Alexa的功能,还具备更强大的能力,可以支持自然、流畅的对话体验。它能够识别不同语调表达的情感,在对话中断时做出反应,并实时回答用户的问题。此外,该机器人的语音经过优化,听起来更加自然,能够用声音传达多种情绪。
这款语音机器人由OpenAI最新的GPT-4o模型驱动,该模型结合了语音、文本和视觉处理能力。为收集用户反馈,OpenAI最初仅向“一小部分”ChatGPT Plus付费用户推出了这一功能,但计划在今年秋季扩展至所有ChatGPT Plus订阅用户。ChatGPT Plus的订阅费用为每月20美元(约合144元人民币)。OpenAI表示,将通过ChatGPT应用程序通知首批用户,并提供使用新模型的详细说明。
这项语音功能于今年5月首次宣布,但因需要更多时间完善安全机制而推迟了一个月发布。例如,改进模型检测和拒绝不良内容的能力,同时优化其基础设施以支持数百万用户的实时响应。
为确保安全性,OpenAI与超过100名外部红队测试人员合作,这些测试人员来自29个国家,掌握45种语言,任务是探测模型可能存在的漏洞。公司还实施了多项安全措施,包括防止模型被用于制作音频深度伪造。为此,OpenAI与配音演员合作创建了四种预设声音,确保GPT-4o不会模仿或生成他人的声音。
然而,OpenAI也曾因使用一种名为“Sky”的声音而引发争议。有用户指出,该声音与女演员斯嘉丽·约翰逊的声音极为相似。对此,约翰逊发表声明称,OpenAI曾试图联系她,希望获得使用其声音的许可,但她拒绝了。尽管OpenAI否认“Sky”声音与约翰逊有关,但公司仍决定暂停使用该声音。
此外,OpenAI还面临多起涉嫌侵犯版权的诉讼。为应对这些问题,公司引入了过滤器,以识别并阻止生成音乐或其他受版权保护音频的请求。同时,OpenAI在其基于文本的模型中采用的安全机制也被应用于GPT-4o,以防止其生成违法或有害内容。
展望未来,OpenAI计划进一步扩展ChatGPT的功能,例如加入视频通话和屏幕共享等高级功能。在5月的一次演示中,员工展示了如何通过手机摄像头拍摄一张纸上的数学方程式,并让AI协助解决问题;他们还共享了电脑屏幕,要求模型帮助解决编程难题。不过,这些功能目前尚未推出,具体上线时间仍有待公布。
相关阅读
-
OpenAI发布可对话的新ChatGPT机器人区块链资讯 2025-05-28 11:40
-
OpenAI颠覆世界:GPT-4o完全免费 实时语音视频交互震撼全场区块链资讯 2025-05-27 20:36
-
OpenAI 升级 Operator 代理:全新 o3 模型提升性能与安全性区块链资讯 2025-05-25 00:26
-
OpenAI 的 Operator 代理通过新的 AI 模型获得提升区块链资讯 2025-05-24 20:39
-
OpenAI CFO谈收购:像io这种公司,不看现在看未来区块链资讯 2025-05-23 16:39
-
OpenAI 以 65 亿美元收购乔纳森·艾维的初创公司 io区块链资讯 2025-05-22 07:33
-
OpenAI 和 AI 同行斥资数百万美元争夺人才区块链资讯 2025-05-22 02:27
-
OpenAI与阿联酋合作建设全球最大数据中心区块链资讯 2025-05-17 21:54
-
FBI发布新的诈骗警告:诈骗分子在短信和语音信息中冒充“美国高级官员”区块链资讯 2025-05-17 09:29
-
OpenAI 的新 Codex 代理助您缩小开发团队规模区块链资讯 2025-05-17 02:28