Spotify 與 OpenAI 的合作將讓播客主持人複製他們的聲音,以自動創建他們節目的外語版本。

Spotify (SPOT-US),音樂串流平台,於週一(25日)宣布推出一項新的人工智慧(AI)功能,能將Podcast以主播原有的聲音,轉譯並播放為多種不同語言。

該公司指出,這項功能利用了OpenAI的語音生成技術,而OpenAI在同一天也對外宣布了這項可以透過幾秒鐘語音製作出極為逼真的合成語音的技術。

Spotify透露,利用這項技術,podcast能保留主播獨有的語音特色,即便被轉譯為不同語言,仍能為聽眾帶來真實自然的聆聽體驗。

儘管Spotify的股價在週一下跌了0.53%,並以每股155.52美元作收,但自今年年初以來已經上漲了將近97%。

用戶體驗如何

如果播客主持人可以輕鬆切換並即時使用另一種語言怎麼辦?這是 Spotify 的新AI語音翻譯功能背後的前提,該功能使用播客主持人自己的聲音重現其他語言的播客。

該公司已與少數播客主持人合作,使用其新工具將他們的英語節目翻譯成西班牙語,並計劃在未來幾週推出法語和德語翻譯。首批節目將來自一些大名鼎鼎的人物,包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons 和 Steven Bartlett。Spotify 計劃將團體擴展到包括來自《The Ringer》的 The Rewatchables 和即將推出的 Trevor Noah 的節目。製作了一些過去及即將上線的節目劇集。Spotify表示,這些節目劇集將首先被轉譯為西班牙語、法語和德語,並將在未來幾天或幾周內免費提供給用戶收聽。

以下是 Spotify 在 Fridman 節目的一個翻譯範例:

翻譯功能的核心是 OpenAI 的語音轉錄工具 Whisper,既可以轉錄英語演講,也可以將其他語言翻譯成英語。但 Spotify 的工具不僅限於語音到文本的翻譯——該功能將播客翻譯成另一種語言,並以播客主持人自己的聲音的合成版本重現它。

“通過匹配創作者自己的聲音,語音翻譯讓全球的聽眾有能力以比以往更真實的方式發現並受到新播客主持人的啟發,” - Spotify 的個性化副總裁 Ziad Sultan 在一份聲明中說。

OpenAI 可能也負責這一新功能的語音複製部分。該 AI 公司今天早上發布了一些公告,包括推出一個可以從僅僅文本和幾秒鐘的樣本演講中創建“如人類般的音頻”的工具。OpenAI 表示,由於對安全和隱私的擔憂,它有意限制這個工具的廣泛可用性。

公司發言人提到,由於這些語言涵蓋了平台上較廣大的聽眾群,試驗階段將首先專注於西班牙語,接著很快會推出德語和法語版本。

關於這個AI功能的具體成本細節,Spotify未作太多透露。發言人補充說,公司目前正在探討如何「將這項服務擴展給全球更多的podcast主播,這只是個開始。」

Share this post