Kostenloses Text-zu-Audio-KI-Modell zur Generierung von Sprache und Musik: Bark

Editor-Bewertungen: Benutzerbewertungen:[Gesamt: 0 Durchschnitt: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }

Bark ist ein kostenloses Open-Source-Text-zu-Audio-Konverter-KI-Modell, mit dem Sie Sprache, Musik und Soundeffekte erzeugen können. Es unterstützt sogar das Klonen von Stimmen, das Sie ausprobieren können. Im Moment können Sie nur die auf Hugging Face gehostete Version ausprobieren und dann ihre Ausgabe analysieren. Wenn Sie es für nützlich halten, können Sie sich einfach den Quellcode holen und es dann an einem beliebigen Ort hosten.

Bark ist wahrscheinlich das einzige verfügbare KI-Modell, das Audio aus Text generieren kann. Sogar Google hat vor einiger Zeit ein ähnliches KI-Modell angekündigt, das aber noch auf den Markt gebracht werden muss. Wenn Sie KI also speziell für die Audiogenerierung verwenden, werden Sie Bark mögen. Es unterstützt kontextbezogene Eingabeaufforderungen mit zusätzlichem Kontext und Musiknoten, damit es weiß, was Sie tun möchten. Sie können es auch dazu bringen, Sprache in der Stimme einer anderen Person zu erzeugen.

Sie können auch in diesem Twitter-Thread mehr über Bark erfahren, wenn Sie möchten.

Mit KI können Sie realistische erstellen Stimmen, Musik, Geräusche.

Aber die meisten Text-zu-Audio-KI-Tools kosten etwa 12 $/Monat.

Hier ist ein kostenloses KI-Tool, mit dem Sie anfangen können, realistische Stimmen nur mit Text zu erstellen: 👇

— Barsee 🐶 (@heyBarsee) 30. April 2023

Kostenloses Text-zu-Audio-KI-Modell zum Generieren von Sprache und Musik: Bark

Wie ich bereits erwähnt habe, dass es sich um Open Source handelt, können Sie schnell darauf zugreifen Quellcode hier oder schau ihn dir einfach an. Im Moment werden 13 Sprachen unterstützt, aber die Unterstützung für weitere Sprachen wird in Kürze in den späteren Updates folgen. Einige der bekannten unterstützten Sprachen in diesem Modell sind:

Englisch (en) ✅ Deutsch (de) ✅ Spanisch (es) ✅ Französisch (fr) ✅ Hindi (hi) ✅ Italienisch (it) ✅ Japanisch (ja ) ✅ Koreanisch (ko) ✅ Polnisch (pl) ✅ Portugiesisch (pt) ✅ Russisch (ru) ✅ Türkisch (tr) ✅ Chinesisch, vereinfacht (zh) ✅

Jetzt hier ist der Link zum Modell, das auf Hugging Face gehostet wird und das Sie ausprobieren können. Es kann bei der Generierung langsam sein, aber es wird funktionieren. Es ist eine Art Proof of Concept, aber wenn Sie es in seinem vollen Potenzial ausführen möchten, können Sie den Quellcode abrufen und ausführen, nachdem Sie die Installationsanweisungen befolgt haben (erforderliche hohe Hardwareanforderungen). Die Hugging Face-Oberfläche sieht so aus.

Geben Sie die Eingabeaufforderung in das Feld ein, oder Sie können auch die dort bereits angegebene Beispielaufforderung ausführen. Wählen Sie einfach einen Redner aus der Liste aus und fahren Sie dann fort. Klicken Sie auf Generieren und dann wird die Ausgabesprache in wenigen Sekunden erzeugt.

Auf die gleiche Weise können Sie die Musik oder Soundeffekte erzeugen. Da auch die Spracherzeugung derselbe Prozess ist, können Sie einfach zwischen Spracherzeugung und Musikerzeugung unterscheiden, indem Sie Noten hinzufügen. Sehen Sie sich das Beispiel unten an und wie die Musiknoten darin eingefügt werden.

♪ Im Dschungel, dem mächtigen Dschungel, bellt der Löwe heute Nacht ♪

In der normalen Texteingabe können Sie Fügen Sie ein Symbol ein, um zusätzliche Effekte wie Lachen, Räuspern usw. hinzuzufügen. Hier ist die Liste einiger unterstützter Nicht-Sprachgeräusche, die Sie in die endgültige Rede aufnehmen können. Sie werden täglich aktualisiert, und Sie können auch Ihre eigenen auf dem Discord-Server von Bark empfehlen.

[Gelächter] [lacht] [seufzt] [Musik] [keucht] [räuspert] — oder … für Zögern

Ein Beispiel: Hallo, mein Name ist Suno. Und, äh – und ich mag Pizza. [lacht]Aber ich habe auch andere Interessen, wie z. B. das Spielen von Tic Tac Toe.

Sehen Sie sich die Platzierung von Nicht-Sprachkomponenten in der Spracherzeugung an.

Auf diese Weise können Sie machen Nutzung dieses kostenlosen und leistungsstarken Text-zu-Audio-Generierungsmodells. Wandeln Sie Text in Sprache um, klonen Sie Stimmen, erzeugen Sie Musik und Soundeffekte. Der Prozess ist einfach und die Hugging Face-Oberfläche macht die Verwendung noch einfacher. Sie können es auch auf Ihrem eigenen Server oder PC hosten, wenn Sie die richtigen Hardwareanforderungen haben.

Schlussworte:

Wenn Sie nach einem kostenlosen KI-Tool suchen, das dies kann Generieren Sie Musik, Sprache und Soundeffekte aus der Beschreibung. Bark ist das beste Werkzeug, um dies zu tun. Damit können Sie Voiceovers für Ihre Videos, Podcasts und sogar Hörbücher generieren. Mir gefiel die Tatsache, dass es mehrsprachig ist und verschiedene Konfigurationsoptionen bietet, um eine perfekte Ausgabe zu erzielen.

Kostenloses Text-zu-Audio-KI-Modell zur Generierung von Sprache und Musik: Bark

Published by IT Info on May 5, 2023

Kostenloses Text-zu-Audio-KI-Modell zum Generieren von Sprache und Musik: Bark

Schlussworte:

IT Info

Kostenlose Open-Source-Alternative zu Zapier zum Erstellen automatisierter Abläufe

IT Info

iPhone 15 Pro-Modelle erhalten schließlich keine Solid-State-Tasten

IT Info

Path of Titans neckt Night Stalker-Update für Mai

Kostenloses Text-zu-Audio-KI-Modell zur Generierung von Sprache und Musik: Bark

Published by IT Info on May 5, 2023

Kostenloses Text-zu-Audio-KI-Modell zum Generieren von Sprache und Musik: Bark

Schlussworte:

Related Posts

IT Info

Kostenlose Open-Source-Alternative zu Zapier zum Erstellen automatisierter Abläufe

IT Info

iPhone 15 Pro-Modelle erhalten schließlich keine Solid-State-Tasten

IT Info

Path of Titans neckt Night Stalker-Update für Mai