Szerkesztői értékelések: Felhasználói értékelések:[Összesen: 0 Átlag: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }

p> A

Bark egy ingyenes és nyílt forráskódú szöveg-hang konvertáló mesterséges intelligencia modell, amely lehetővé teszi beszéd, zene és hangeffektusok generálását. Még a hangklónozást is támogatja, amelyet kipróbálhat. Jelenleg csak a Hugging Face-en tárolt verziót próbálhatja ki, majd elemezheti annak kimenetét. Ha hasznosnak találja, egyszerűen megragadhatja a forráskódját, és bárhol tárolhatja.

A Bark valószínűleg az egyetlen elérhető mesterséges intelligencia-modell, amely képes szövegből hangot generálni. Még a Google is bejelentett egy hasonló mesterséges intelligencia-modellt egy ideje, de ez még várat magára. Tehát, ha AI-t használsz, különösen hanggeneráláshoz, akkor tetszeni fog a Bark. Támogatja a kontextusra szabott promptokat további kontextussal és zenei hangjegyekkel, így tudni fogja, mit szeretne tenni. Azt is beállíthatja, hogy beszédet generáljon egy másik személy hangján.

Ha szeretné, ebben a Twitter-szálban többet is megtudhat Barkról.

A mesterséges intelligencia lehetővé teszi, hogy valósághű képet alkosson hangok, zene, hangok.

A legtöbb szöveg-hang AI-eszköz azonban körülbelül 12 USD/hóba kerül.

Íme egy ingyenes AI-eszköz, amellyel valósághű hangokat hozhat létre szöveggel: 👇

— Barsee 🐶 (@heyBarsee) 2023. április 30.

Szövegből audio AI-modell beszéd és zene generálásához: Bark

Ahogy már említettem, hogy nyílt forráskódú, gyorsan megragadhatja forráskód itt, vagy egyszerűen csak nézze meg. Egyelőre 13 nyelvet támogat, de hamarosan több nyelv támogatása is megjelenik a későbbi frissítésekben. Néhány jól ismert támogatott nyelv ebben a modellben:

angol (en) ✅ német (de) ✅ spanyol (es) ✅ francia (fr) ✅ hindi (szia) ✅ olasz (it) ✅ japán (ja) ) ✅ koreai (ko) ✅ lengyel (pl) ✅ portugál (pt) ✅ orosz (ru) ✅ török ​​(tr) ✅ kínai, egyszerűsített (zh) ✅

Most, itt található a Hugging Face-en tárolt modell linkje, amelyet kipróbálhat. Lehet lassú a generáció, de működni fog. Ez egyfajta bizonyíték az elgondolásra, de ha teljes potenciálját szeretné használni, akkor megragadhatja a forráskódot, és futtathatja a telepítési utasítások követése után (szükséges hardverkövetelmények). A Hugging Face felület így néz ki.

Írja be a promptot a mezőbe, vagy lefuttathatja az ott megadott példapromptot is. Csak válasszon ki egy hangszórót a listából, és menjen tovább. Kattintson a generálás gombra, és néhány másodpercen belül előállítja a kimeneti beszédet.

Ugyanígy generálhat zenét vagy hangeffektusokat. Mivel a beszédgenerálás is ugyanaz a folyamat, így egyszerűen megkülönböztetheti a beszédgenerálást a zenegenerálástól a jegyzetek hozzáadásával. Tekintse meg az alábbi példát, és a hangjegyek beillesztésének módját.

♪ A dzsungelben, a hatalmas dzsungelben ma este ugat az oroszlán ♪

A normál szövegbevitellel szúrjon be valamilyen szimbólumot további effektusok hozzáadásához, például nevetés, torokköszörülés stb. Íme néhány támogatott, nem beszédhangok listája, amelyeket beilleszthet a záróbeszédbe. Naponta frissülnek, és a Bark Discord szerverén is ajánlhatod a sajátodat.

[nevetés] [nevet] [sóhaj] [zene] [liheg] [torkot köszörül] – vagy … habozásra.

Egy példa: Hello, a nevem Suno. És… és szeretem a pizzát. [nevet] De más érdeklődési köröm is van, például a tic tac toe játék.

Nézze meg a nem beszédkomponensek elhelyezését a beszédgenerálásban.

Ily módon ennek az ingyenes és hatékony szövegből hanggeneráló modellnek a használata. Szöveg beszédté alakítása, hangok klónozása, zene és hangeffektusok generálása. A folyamat egyszerű, és a Hugging Face felület még sokkal könnyebbé teszi a használatát. Ezenkívül saját szerverén vagy számítógépén is tárolhatja, ha megfelelő hardverkövetelményekkel rendelkezik.

Zárszó:

Ha egy ingyenesen használható mesterséges intelligencia eszközt keres, amely képes zenét, beszédet és hanghatásokat generál a leírásból, a Bark az első számú eszköz ehhez. Ezzel hangfelvételeket generálhat videóihoz, podcastjaihoz és akár hangoskönyveihez is. Tetszett, hogy többnyelvű, és különféle konfigurációs lehetőségeket kínál a tökéletes kimenet érdekében.

Categories: IT Info