Oceny redaktorów: Oceny użytkowników: [Razem: 0 Średnia: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }

Bark to darmowy model AI konwertera tekstu na audio o otwartym kodzie źródłowym, który umożliwia generowanie mowy, muzyki i efektów dźwiękowych. Obsługuje nawet klonowanie głosu, które możesz wypróbować. W tej chwili możesz tylko wypróbować wersję hostowaną na Hugging Face, a następnie przeanalizować jej wyniki. Jeśli okaże się to przydatne, możesz po prostu pobrać jego kod źródłowy i umieścić go w dowolnym miejscu.

Bark jest prawdopodobnie jedynym dostępnym modelem AI, który może generować dźwięk z tekstu. Nawet Google ogłosił jakiś czas temu podobny model sztucznej inteligencji, ale nie został on jeszcze uruchomiony. Tak więc, jeśli używasz sztucznej inteligencji szczególnie do generowania dźwięku, spodoba ci się Bark. Obsługuje podpowiedzi kontekstowe z dodatkowym kontekstem i nutami muzycznymi, dzięki czemu będzie wiedział, co chcesz zrobić. Możesz także sprawić, by generował mowę głosem innej osoby.

Możesz także dowiedzieć się więcej o Bark w tym wątku na Twitterze, jeśli chcesz.

AI pozwala tworzyć realistyczne głosy, muzyka, dźwięki.

Ale większość narzędzi sztucznej inteligencji przetwarzających tekst na dźwięk kosztuje około 12 USD miesięcznie.

Oto bezpłatne narzędzie sztucznej inteligencji, które pozwala rozpocząć tworzenie realistycznych głosów za pomocą samego tekstu: 👇

— Barsee 🐶 (@heyBarsee) 30 kwietnia 2023 r.

Darmowy model AI tekstu do audio do generowania mowy i muzyki: Bark

Jak już wspomniałem, że jest to oprogramowanie typu open source, możesz szybko pobrać jego kod źródłowy tutaj lub po prostu spójrz na niego. Na razie obsługuje 13 języków, ale obsługa kolejnych języków pojawi się wkrótce w późniejszych aktualizacjach. Niektóre z dobrze znanych języków obsługiwanych w tym modelu to:

angielski (en) ✅ niemiecki (de) ✅ hiszpański (es) ✅ francuski (fr) ✅ hindi (hi) ✅ włoski (it) ✅ japoński (ja ) ✅ Koreański (ko) ✅ Polski (pl) ✅ Portugalski (pt) ✅ Rosyjski (ru) ✅ Turecki (tr) ✅ Chiński uproszczony (zh) ✅

Teraz tutaj jest link do modelu hostowanego na Hugging Face, który możesz wypróbować. Generowanie może być powolne, ale będzie działać. Jest to rodzaj weryfikacji koncepcji, ale jeśli chcesz uruchomić go w pełni, możesz pobrać kod źródłowy i uruchomić go po wykonaniu instrukcji instalacji (wymagane duże wymagania sprzętowe). Interfejs Hugging Face wygląda tak.

Wpisz monit w polu lub możesz też uruchomić podany tam przykładowy monit. Po prostu wybierz głośnik z listy, a następnie przejdź do przodu. Kliknij generuj, a następnie wygeneruje mowę wyjściową w ciągu kilku sekund.

W ten sam sposób możesz wygenerować muzykę lub efekty dźwiękowe. Ponieważ generowanie mowy jest również tym samym procesem, możesz po prostu rozróżnić generowanie mowy od generowania muzyki, dodając notatki. Zobacz poniższy przykład i sposób wstawiania nut.

♪ W dżungli, potężnej dżungli, tej nocy szczeka lew ♪

W normalnym trybie wprowadzania tekstu możesz wstaw symbol, aby dodać dodatkowe efekty, takie jak śmiech, odchrząknięcie itp. Oto lista niektórych obsługiwanych dźwięków innych niż mowa, które możesz uwzględnić w końcowym przemówieniu. Są one codziennie aktualizowane, a swoje własne możesz polecić na serwerze Discord w Bark.

[śmiech] [śmiech] [wzdycha] [muzyka] [sapanie] [odchrząkanie] — lub … w przypadku wahań

Przykład: Cześć, nazywam się Suno. I, uh-i lubię pizzę. [śmiech] Ale mam też inne zainteresowania, takie jak gra w kółko i krzyżyk.

Zobacz rozmieszczenie elementów niezwiązanych z mową podczas generowania mowy.

W ten sposób możesz korzystanie z tego bezpłatnego i wydajnego modelu generowania tekstu na dźwięk. Konwertuj tekst na mowę, klonuj głosy, generuj muzykę i efekty dźwiękowe. Proces jest łatwy, a interfejs Hugging Face sprawia, że ​​jest jeszcze łatwiejszy w użyciu. Możesz także hostować go na własnym serwerze lub komputerze, jeśli masz odpowiednie wymagania sprzętowe.

Słowa końcowe:

Jeśli szukasz darmowego narzędzia AI, które może generować muzykę, mowę i efekty dźwiękowe na podstawie opisu Kora jest najlepszym narzędziem do tego. Dzięki temu możesz generować podkłady głosowe do swoich filmów, podcastów, a nawet książek audio. Podobał mi się fakt, że jest wielojęzyczny i oferuje różne opcje konfiguracji, aby uzyskać doskonałe wyniki.

Categories: IT Info