OpenAI 的語音 AI 模型之前曾給演員斯嘉麗約翰遜帶來麻煩,但這並沒有阻止該公司繼續推進其在這一類別的產品。
今天,ChatGPT 製造商推出了三種新的專有語音模型:gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。這些模型最初將透過 ChatGPT 製造商的應用程式介面 (API) 提供,供第三方軟體開發人員建立自己的應用程式。它們也將在自訂演示網站OpenAI.fm上提供,個人用戶可以訪問該網站進行有限的測試和娛樂。
此外,可以透過文字提示從幾個預設中自訂 GPT-4O-MINI-TTS 模型聲音,以改變其口音、音調、聲調和其他聲音特質——包括傳達用戶要求的任何情緒,這在很大程度上解決了 OpenAI 故意模仿任何特定用戶聲音的擔憂(該公司之前否認約翰遜的情況,但無論如何還是取消了表面上模仿的聲音選項)。現在,用戶可以決定他們希望 AI 語音回覆時的聲音效果。
在與 VentureBeat 透過視訊通話進行的演示中,OpenAI 技術人員 Jeff Harris 展示瞭如何僅使用演示網站上的文本,用戶可以讓相同的聲音聽起來像咯咯笑的瘋狂科學家或禪宗、平靜的瑜伽老師。
Picture Source:
pixabay