Texte gratuit vers un modèle d'IA audio pour générer de la parole et de la musique : Bark

Notes de l’éditeur : Notes des utilisateurs :[Total : 0 Moyenne : 0] @media(min-width : 500px) { } @media(min-width : 800px) { }

Bark est un modèle d’IA de conversion de texte en audio gratuit et open-source qui vous permet de générer de la parole, de la musique et des effets sonores. Il prend même en charge le clonage vocal que vous pouvez essayer. Pour le moment, vous ne pouvez essayer que la version hébergée sur Hugging Face, puis analyser sa sortie. Si vous le trouvez utile, vous pouvez simplement récupérer son code source et l’héberger où vous voulez.

Bark est probablement le seul modèle d’IA disponible qui peut générer de l’audio à partir de texte. Même Google a annoncé il y a quelque temps un modèle d’IA similaire, mais qui n’a pas encore été lancé. Donc, si vous utilisez l’IA en particulier pour la génération audio, vous allez aimer Bark. Il prend en charge les invites contextualisées avec un contexte supplémentaire et des notes de musique afin qu’il sache ce que vous voulez faire. Vous pouvez également lui faire générer un discours dans la voix d’une autre personne.

Vous pouvez également en savoir plus sur Bark dans ce fil Twitter si vous le souhaitez.

L’IA vous permet de créer des voix, musique, sons.

Mais la plupart des outils d’IA text-to-audio coûtent environ 12 $/mois.

Voici un outil d’IA gratuit pour commencer à créer des voix réalistes uniquement avec du texte : 👇

— Barsee 🐶 (@heyBarsee) 30 avril 2023

Modèle d’IA de texte gratuit en audio pour générer de la parole et de la musique : Bark

Comme je l’ai déjà mentionné, il est open source, vous pouvez rapidement saisir son code source ici ou jetez-y simplement un coup d’œil. Pour l’instant, il prend en charge 13 langues, mais la prise en charge d’autres langues sera bientôt disponible dans les mises à jour ultérieures. Certaines des langues bien connues prises en charge dans ce modèle sont:

Anglais (en) ✅ Allemand (de) ✅ Espagnol (es) ✅ Français (fr) ✅ Hindi (hi) ✅ Italien (it) ✅ Japonais (ja ) ✅ Coréen (ko) ✅ Polonais (pl) ✅ Portugais (pt) ✅ Russe (ru) ✅ Turc (tr) ✅ Chinois simplifié (zh) ✅

Maintenant, voici le lien vers le modèle hébergé sur Hugging Face que vous pouvez essayer. Il peut être lent en génération, mais cela fonctionnera. C’est une sorte de preuve de concept, mais si vous voulez l’exécuter dans son plein potentiel, vous pouvez récupérer le code source et l’exécuter après avoir suivi les instructions d’installation (exigences matérielles lourdes requises). L’interface Hugging Face ressemble à ceci.

Entrez l’invite dans la case, ou vous pouvez également exécuter l’exemple d’invite qui y est déjà donné. Sélectionnez simplement un haut-parleur dans la liste, puis continuez. Cliquez sur générer, puis il produira le discours de sortie en quelques secondes.

De la même manière, vous pouvez générer la musique ou les effets sonores. Étant donné que la génération de la parole est également le même processus, vous pouvez simplement faire la distinction entre la génération de la parole et la génération de musique en ajoutant des notes. Voir l’exemple ci-dessous et comment les notes de musique y sont insérées.

♪ Dans la jungle, la puissante jungle, le lion aboie ce soir ♪

Dans la saisie de texte normale, vous pouvez insérez un symbole pour ajouter des effets supplémentaires tels que rire, se racler la gorge, etc. Voici la liste de certains sons non vocaux pris en charge que vous pouvez choisir d’inclure dans le discours final. Ils sont mis à jour quotidiennement, et vous pouvez également recommander les vôtres sur le serveur Discord de Bark.

[rires] [rires] [soupirs] [musique] [halètements] [s’éclaircit la gorge] – ou … pour les hésitations

Un exemple : Bonjour, je m’appelle Suno. Et, euh-et j’aime la pizza. [rires]Mais j’ai aussi d’autres centres d’intérêt, comme jouer au tic tac toe.

Voir le placement des composants non vocaux dans la génération de la parole.

De cette façon, vous pouvez faire utilisation de ce modèle de génération de texte en audio gratuit et puissant. Convertissez du texte en parole, clonez des voix, générez de la musique et des effets sonores. Le processus est simple et l’interface Hugging Face le rend encore plus facile à utiliser. De plus, vous pouvez l’héberger sur votre propre serveur ou PC si vous avez la configuration matérielle requise.

Mots de clôture :

Si vous recherchez un outil d’IA gratuit qui peut générer de la musique, de la parole et des effets sonores à partir de la description, le Bark est l’outil numéro un pour le faire. Avec cela, vous pouvez générer des voix off pour vos vidéos, podcasts et même des livres audio. J’ai aimé le fait qu’il soit multilingue et offre diverses options de configuration pour produire une sortie parfaite.

Texte gratuit vers un modèle d’IA audio pour générer de la parole et de la musique : Bark

Published by IT Info on May 6, 2023

Modèle d’IA de texte gratuit en audio pour générer de la parole et de la musique : Bark

Mots de clôture :

IT Info

Alternative Open Source gratuite à Zapier pour créer des flux automatisés

IT Info

5 sites Web d’analyseur de spectrogramme audio en ligne

IT Info

Chatbot IA gratuit permettant aux agriculteurs de poser des questions sur l’agriculture

Texte gratuit vers un modèle d’IA audio pour générer de la parole et de la musique : Bark

Published by IT Info on May 6, 2023

Modèle d’IA de texte gratuit en audio pour générer de la parole et de la musique : Bark

Mots de clôture :

Related Posts

IT Info

Alternative Open Source gratuite à Zapier pour créer des flux automatisés

IT Info

5 sites Web d’analyseur de spectrogramme audio en ligne

IT Info

Chatbot IA gratuit permettant aux agriculteurs de poser des questions sur l’agriculture