Calificaciones del editor: Calificaciones de los usuarios:[Total: 0 Promedio: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }
Bark es un modelo de AI convertidor de texto a audio gratuito y de código abierto que le permite generar voz, música y efectos de sonido. Incluso admite la clonación de voz que puedes probar. En este momento, solo puede probar la versión alojada en Hugging Face y luego analizar su salida. Si encuentra que es útil, puede obtener su código fuente y alojarlo en cualquier lugar que desee.
Bark es probablemente el único modelo de IA disponible que puede generar audio a partir de texto. Incluso Google anunció un modelo de IA similar hace un tiempo, pero aún no se ha lanzado. Entonces, si usa IA particularmente para la generación de audio, entonces le gustará Bark. Admite indicaciones contextualizadas con contexto adicional y notas musicales para que sepa lo que desea hacer. También puede hacer que genere voz en la voz de otra persona.
Si lo desea, también puede obtener más información sobre Bark en este hilo de Twitter.
La IA le permite crear voces, música, sonidos.
Pero la mayoría de las herramientas de inteligencia artificial de texto a audio cuestan alrededor de $ 12/mes.
Aquí hay una herramienta de inteligencia artificial gratuita para comenzar a crear voces realistas solo con texto: 👇
— Barsee 🐶 (@heyBarsee) 30 de abril de 2023
Modelo de IA de texto libre a audio para generar voz y música: Bark
Como ya mencioné que es de código abierto, puede obtener rápidamente su código fuente aquí o simplemente échale un vistazo. Por ahora, tiene soporte para 13 idiomas, pero pronto habrá soporte para más idiomas en las actualizaciones posteriores. Algunos de los idiomas admitidos conocidos en este modelo son:
Inglés (en) ✅ Alemán (de) ✅ Español (es) ✅ Francés (fr) ✅ Hindi (hi) ✅ Italiano (it) ✅ Japonés (ja) ) ✅ coreano (ko) ✅ polaco (pl) ✅ portugués (pt) ✅ ruso (ru) ✅ turco (tr) ✅ chino simplificado (zh) ✅
Ahora, aquí está el enlace al modelo alojado en Hugging Face que puedes probar. Puede ser lento en generación, pero funcionará. Es una especie de prueba de concepto, pero si desea ejecutarlo en todo su potencial, puede obtener el código fuente y ejecutarlo después de seguir las instrucciones de instalación (requisitos de hardware pesados requeridos). La interfaz de Hugging Face se ve así.
Ingrese el aviso en el cuadro, o también puede ejecutar el aviso de ejemplo dado allí. Simplemente seleccione un orador de la lista y luego continúe. Haga clic en generar y luego producirá el discurso de salida en unos segundos.
De la misma manera, puede generar la música o los efectos de sonido. Dado que la generación de voz también es el mismo proceso, simplemente puede distinguir entre la generación de voz y la generación de música agregando notas. Vea el ejemplo a continuación y cómo se insertan las notas musicales en él.
♪ En la jungla, la poderosa jungla, el león ladra esta noche ♪
En la entrada de texto normal, puede inserte algún símbolo para agregar efectos adicionales como reír, carraspear, etc. Aquí está la lista de algunos sonidos que no son del habla admitidos que puede optar por incluir en el discurso final. Se actualizan a diario y también puedes recomendar los tuyos en el servidor de Discord de Bark.
[risas] [risas] [suspiros] [música] [jadeos] [aclara la garganta] — o … por dudas
Un ejemplo: Hola, mi nombre es Suno. Y, eh, y me gusta la pizza. [risas] Pero también tengo otros intereses, como jugar tres en raya.
Ver la ubicación de los componentes que no son del habla en la generación del habla.
De esta manera, puedes hacer uso de este potente y gratuito modelo de generación de texto a audio. Convierta texto a voz, clone voces, genere música y efectos de sonido. El proceso es fácil y la interfaz Hugging Face hace que sea mucho más fácil de usar. Además, puede alojarlo en su propio servidor o PC si tiene los requisitos de hardware correctos.
Palabras finales:
Si está buscando una herramienta de IA de uso gratuito que pueda generar música, voz y efectos de sonido a partir de la descripción, Bark es la herramienta número uno para hacerlo. Con esto, puede generar voces en off para sus videos, podcasts e incluso audiolibros. Me gustó el hecho de que es multilingüe y ofrece varias opciones de configuración para producir resultados perfectos.