Im Jahr 2023 können Sie nicht darauf verzichten, über generative KI zu sprechen, während Sie über Technologie diskutieren. Ob KI-Codierungstools, lokale LLMs oder KI-Bildgeneratoren – die Technologie ist in fast alles eingedrungen und Unternehmen passen sich schnell an die neue Technologie an. ElevenLabs ist ein solches Unternehmen, das sich auf Sprachsynthese und Stimmenklonen mithilfe von KI spezialisiert hat. Mit ElevenLabs AI können Sie natürliche Sprache aus Text generieren und Ihre Stimme mit nahezu perfekter Genauigkeit klonen. Gehen Sie also dieses Tutorial durch und lernen Sie, wie das geht.

Inhaltsverzeichnis

So verwenden Sie ElevenLabs AI, um natürliche Sprache aus Text zu generieren

Die Nutzung von ElevenLabs ist für einzelne Benutzer kostenlos. Im kostenlosen Kontingent können Sie in einem Monat Sprache aus Texten mit bis zu 10.000 Zeichen generieren. Sie können auch Sprache in mehreren Sprachen und mit mehreren Akzenten generieren. Das heißt, so funktioniert dieses KI-Tool:

1. Gehen Sie zur ElevenLabs-Website (besuchen) und klicken Sie auf „Anmelden“, um eine zu erstellen kostenloser Account.

2. Nach der Anmeldung gelangen Sie auf die Seite „Sprachsynthese“. Hier in den Einstellungen können Sie verschiedene Stimmen in der Vorschau anzeigen und Ihre bevorzugte Stimme auswählen.

3. Sie können auch direkt unten das Audiomodell auswählen. Wenn Ihr Text auf Englisch ist, wählen Sie Eleven Monolingual v1. Falls Ihr Text in anderen Sprachen verfasst ist, darunter Englisch, Deutsch, Hindi, Spanisch, Italienisch, Französisch, Portugiesisch oder Polnisch, wählen Sie hier „Eleven Multilingual v1“.

4. Geben Sie abschließend den Text unten ein und klicken Sie auf „Generieren“, damit ElevenLabs AI Ihren Text in Sprache umwandelt.

5. Hier habe ich die Rede aus einem Beispieltext mit Sams Stimme generiert. Sie können auf die Schaltfläche „Herunterladen“ klicken, um die generierte Rede im MP3-Format zu erhalten.

6. Sie können den Text auch in einer anderen Sprache eingeben und die Sprache perfekt erzeugen. Stellen Sie sicher, dass Sie im Dropdown-Menü das Modell „Mehrsprachig“ auswählen.

7. Sie können Ihre Stimme auch mit ElevenLabs AI klonen, was wir unten demonstriert haben. Es gibt jedoch eine Bibliothek mit Sprachbeispielen mit unterschiedlichen Akzenten, die Sie aus der Sprachbibliothek hinzufügen können.

8. Klicken Sie neben Ihrer bevorzugten Rede auf „Zu VoiceLab hinzufügen“. Hier füge ich zum Beispiel eine junge Männerstimme mit britischem Akzent hinzu.

9. Wählen Sie nun einfach die Stimme aus dem Dropdown-Menü aus und generieren Sie die Sprache. Du bist fertig.

So verwenden Sie die KI von ElevenLabs, um Ihre Stimme zu klonen

Vielleicht haben Sie bereits Leute auf Instagram und TikTok gesehen, die das Klonen von Stimmen nutzen, um prominente Persönlichkeiten wie Obama, Drake usw. zu klonen viele andere sagen zufällige Dinge. Früher bot ElevenLabs das Klonen von Stimmen kostenlos an, aber jetzt müssen Sie 5 $ bezahlen, um bis zu 10 benutzerdefinierte Stimmen zu erstellen. Falls Sie nicht zahlen möchten, können Sie PlayHT (besuchen) verwenden, um Ihre Stimme kostenlos zu klonen. In diesem Artikel werde ich ElevenLabs AI verwenden, um meine Stimme zu klonen.

1. Um Ihre Stimme mit ElevenLabs AI zu klonen, klicken Sie oben auf „Voice Lab“. Klicken Sie anschließend auf Generative oder geklonte Stimme hinzufügen.

2. Klicken Sie anschließend auf Instant Voice Cloning.

3. Geben Sie hier Ihrer Stimme einen Namen. Anschließend laden Sie Ihr aufgenommenes Audio hoch. Stellen Sie sicher, dass die Aufnahme keine lauten Hintergrundgeräusche aufweist. Für eine bessere Sprachsynthese wird empfohlen, mindestens 5 Minuten Audio hochzuladen. Schreiben Sie unten eine Beschreibung und klicken Sie auf die Schaltfläche „Stimme hinzufügen“.

4. Nach ein paar Sekunden ist Ihre Stimme geklont und einsatzbereit. Klicken Sie auf „Verwenden“, um damit sofort Text in Sprache umzuwandeln.

5. Stellen Sie hier sicher, dass Ihre Stimme im Dropdown-Menü ausgewählt ist. Fügen Sie nun Ihren Text hinzu und klicken Sie auf Generieren. Es dauert einige Sekunden, Ihre Sprache zu synthetisieren und Audio zu erzeugen. Sie können jetzt auch die Audiodatei herunterladen.

Meiner Meinung nach hat ElevenLabs AI meine Stimme trotz des Hochladens einer 5-minütigen Audiodatei nicht gut geklont. Möglicherweise muss ich weitere Audiobeispiele hinzufügen und das Modell erneut trainieren. Oder es könnte daran liegen, dass das KI-Modell die Ausgabe in Englisch (USA) liefert, anstatt den Akzent für Indien zu lokalisieren. Außerdem gab es in meinem Hörbeispiel einige Hintergrundgeräusche, die möglicherweise die Qualität beeinträchtigt haben. Dennoch ist es ein spannendes KI-Projekt und wir werden alle neuen Fortschritte in der Sprachsynthese im Auge behalten.

Einen Kommentar hinterlassen

Die RTX 4060 Ti ist endlich da und kommt mit der Basis-RTX 4060 zu einem attraktiven Preis, der Gamer dazu bringt, über ein Upgrade ihrer Grafikkarte nachzudenken. Aber sollten Sie? Wir werden in die Tiefe gehen und die RTX 4060 vergleichen […]

Im Internet wird viel über AR (Augmented Reality) vs. VR (Virtual Reality) diskutiert, daher werde ich nicht weiter darauf eingehen das Feuer, aber eines der Dinge, die uns bei der Verwendung des Nreal Air aufgefallen sind, ist, dass die VR […]

Es gibt einige fragwürdige Designentscheidungen in Redfall, einem Mischmasch der unausgegorenen berühmten Arkane-Formel. Ich liebe Spiele von Arkane Studios, wobei Dishonored zu einem Titel geworden ist, den ich hin und wieder wegen seines einzigartigen, aufstrebenden Gameplays wieder aufrufe. Und […]

Categories: IT Info