OpenAI 正在逐步向部分 ChatGPT Plus 用戶推出進階語音模式。該公司今日在 X 平台上公告了此事。進階語音模式帶來了更自然、即時的對話體驗,使用戶可以隨時打斷,並能夠感知及響應用戶的情感。參與本次測試的用戶將會收到電子郵件和手機應用程式中的通知,告訴他們如何使用此功能。OpenAI 將會持續招募更多的參與者,並計劃在秋季使所有 Plus 用戶均可使用此功能。之前提到的視頻和屏幕共享功能將在稍後時候推出。
OpenAI 在五月的活動中首次展示了這個功能,但因為安全問題及 Scarlett Johansson 的投訴而延遲推出,後者聲稱該語音聽起來像她的聲音。該公司表示,已經建立了系統以增強安全性,防止模型使用四個以外的預設聲音。自首次展示進階語音模式以來,OpenAI 一直在努力提升語音對話的安全性及質量,為將這項尖端技術帶給數百萬人做好準備。該公司與 100 多名外部測試者一同在 45 種語言中測試了 GPT-4o 的語音能力。
為了保障用戶的隱私,模型僅被訓練為使用四個預設聲音,並且建立了系統以阻止其他不同的聲音輸出。此外,OpenAI 還實施了防護措施,防止對暴力或版權內容的請求。關於 GPT-4o 的能力、限制及安全評估的詳細報告將於八月初公布。
值得一提的是,Apple 已經與 OpenAI 進行合作,將 ChatGPT 整合進 iOS 18、iPadOS 18 和 macOS Sequoia 的用戶體驗中。