編輯評分: 用戶評分:[總計:0 平均:0] @media(min-width: 500px) { } @media(min-width: 800px) { }

Bark 是一個免費和開源的文本到音頻轉換器 AI 模型,可讓您生成語音、音樂和聲音效果。它甚至支持您可以嘗試的語音克隆。現在,您只能試用 Hugging Face 上託管的版本,然後分析其輸出。如果您發現它很有用,那麼您只需獲取它的源代碼,然後將其託管在您喜歡的任何地方。

Bark 可能是目前唯一可以從文本生成音頻的 AI 模型。甚至谷歌不久前也宣布了一種類似的人工智能模型,但尚未推出。所以,如果你專門使用 AI 來生成音頻,那麼你會喜歡 Bark。它支持帶有附加上下文和音符的上下文提示,以便它知道您想要做什麼。您還可以讓它以其他人的聲音生成語音。

如果需要,您還可以在此 Twitter 線程中了解有關 Bark 的更多信息。

AI 允許您創建逼真的圖像語音、音樂、聲音。

但是大多數文本到音頻的 AI 工具每月花費大約 12 美元。

這是一個免費的 AI 工具,可以開始只用文本創建逼真的聲音:👇

— Barsee 🐶 (@heyBarsee) 2023 年 4 月 30 日

免費文本到音頻 AI 模型以生成語音和音樂:Bark

正如我已經提到的,它是開源的,您可以快速獲取它源代碼在這里或者簡單地看一下它。目前,它支持 13 種語言,但在以後的更新中很快就會支持更多語言。此模型中一些眾所周知的支持語言是:

英語 (en) ✅ 德語 (de) ✅ 西班牙語 (es) ✅ 法語 (fr) ✅ 印地語 (hi) ✅ 意大利語 (it) ✅ 日語 (ja ) ✅ 韓語 (ko) ✅ 波蘭語 (pl) ✅ 葡萄牙語 (pt) ✅ 俄語 (ru) ✅ 土耳其語 (tr) ✅ 簡體中文 (zh) ✅

現在,這裡是模型的鏈接 託管在 Hugging Face 上,您可以嘗試一下。它的生成速度可能很慢,但它會起作用。它是一種概念驗證,但如果您想充分發揮它的潛力,那麼您可以獲取源代碼並在按照安裝說明(需要大量硬件要求)後運行它。 Hugging Face 界面如下所示。

在框中輸入提示,或者您也可以運行那裡已經給出的示例提示。只需從列表中選擇一位發言人,然後繼續。點擊generate,幾秒後就會生成輸出語音。

同理可以生成音樂或音效。由於語音生成也是相同的過程,因此,您可以通過添加音符來簡單區分語音生成和音樂生成。看下面的例子,音符是怎麼插入進去的。

♪叢林裡,雄偉的叢林,今晚獅子在叫♪

在普通的文本輸入中,你可以插入一些符號以添加額外的效果,例如大笑、清嗓子等。這是一些支持的非語音聲音的列表,您可以選擇將其包含在最終語音中。它們每天都在更新,您也可以在 Bark 的 Discord 服務器中推薦您自己的。

[笑聲] [笑聲] [嘆氣] [音樂] [喘氣] [清喉嚨]-或者…猶豫

舉個例子:你好,我叫蘇諾。而且,呃-我喜歡披薩。 [笑]但我也有其他興趣,比如玩井字遊戲。

看看非語音成分在語音生成中的放置。

這樣,你可以使用這種免費且功能強大的文本到音頻生成模型。將文本轉換為語音、克隆語音、生成音樂和音效。這個過程很簡單,Hugging Face 界面使它更容易使用。此外,如果您有合適的硬件要求,您可以將其託管在您自己的服務器或 PC 上。

結束語:

如果您正在尋找一個免費使用的 AI 工具,它可以根據描述生成音樂、語音和聲音效果 Bark 是執行此操作的頭號工具。有了它,您可以為您的視頻、播客甚至有聲讀物生成畫外音。我喜歡它是多語言的,並提供各種配置選項以產生完美的輸出。

Categories: IT Info