Valutazioni dell’editore: Valutazioni degli utenti:[Totale: 0 Media: 0] @media(larghezza minima: 500px) { } @media(larghezza minima: 800px) { }

Bark è un modello AI di conversione da testo ad audio gratuito e open source che ti consente di generare parlato, musica ed effetti sonori. Supporta anche la clonazione vocale che puoi provare. Al momento, puoi solo provare la versione ospitata su Hugging Face e quindi analizzarne l’output. Se lo trovi utile, puoi semplicemente prendere il suo codice sorgente e poi ospitarlo ovunque tu voglia.

Bark è probabilmente l’unico modello di intelligenza artificiale disponibile là fuori in grado di generare audio dal testo. Anche Google ha annunciato un modello di intelligenza artificiale simile qualche tempo fa, ma deve ancora essere lanciato. Quindi, se usi l’intelligenza artificiale in particolare per la generazione audio, ti piacerà Bark. Supporta prompt contestualizzati con contesto aggiuntivo e note musicali in modo che sappia cosa vuoi fare. Puoi anche fare in modo che generi un discorso con la voce di un’altra persona.

Puoi anche saperne di più su Bark in questo thread di Twitter, se lo desideri.

L’AI ti consente di creare immagini realistiche voci, musica, suoni.

Ma la maggior parte degli strumenti di intelligenza artificiale da testo ad audio costa circa $ 12 al mese.

Ecco uno strumento di intelligenza artificiale gratuito per iniziare a creare voci realistiche solo con il testo: 👇

— Barsee 🐶 (@heyBarsee) 30 aprile 2023

Modello di intelligenza artificiale da testo ad audio gratuito per generare parlato e musica: Bark

Come ho già detto che è open source, puoi prenderne rapidamente codice sorgente qui o semplicemente dagli un’occhiata. Per ora, ha il supporto per 13 lingue, ma il supporto per più lingue arriverà presto negli aggiornamenti successivi. Alcune delle ben note lingue supportate in questo modello sono:

Inglese (en) ✅ Tedesco (de) ✅ Spagnolo (es) ✅ Francese (fr) ✅ Hindi (hi) ✅ Italiano (it) ✅ Giapponese (ja ) ✅ Coreano (ko) ✅ Polacco (pl) ✅ Portoghese (pt) ✅ Russo (ru) ✅ Turco (tr) ✅ Cinese semplificato (zh) ✅

Ora, ecco il link al modello ospitato su Hugging Face che puoi provare. Può essere lento nella generazione, ma funzionerà. È una specie di prova concettuale, ma se vuoi eseguirlo al massimo delle sue potenzialità, puoi prendere il codice sorgente ed eseguirlo dopo aver seguito le istruzioni di installazione (richiesti requisiti hardware pesanti). L’interfaccia di Hugging Face ha questo aspetto.

Inserisci il prompt nella casella, oppure puoi anche eseguire il prompt di esempio già fornito. Basta selezionare un relatore dall’elenco e poi andare avanti. Fai clic su Genera e quindi produrrà il discorso di output in pochi secondi.

Allo stesso modo, puoi generare la musica o gli effetti sonori. Poiché anche la generazione del parlato è lo stesso processo, puoi semplicemente distinguere tra generazione del parlato e generazione della musica aggiungendo note. Guarda l’esempio qui sotto e come sono inserite le note musicali.

♪ Nella giungla, la possente giungla, stanotte il leone abbaia ♪

Nel normale input di testo, puoi inserisci qualche simbolo per aggiungere effetti extra come ridere, schiarirsi la gola, ecc. Ecco l’elenco di alcuni suoni non vocali supportati che puoi scegliere di includere nel discorso finale. Vengono aggiornati quotidianamente e puoi anche consigliare i tuoi nel server Discord di Bark.

[risate] [ride] [sospira] [musica] [sussulta] [si schiarisce la voce] — o … per le esitazioni

Un esempio: Ciao, mi chiamo Suno. E, uh… e mi piace la pizza. [ride]Ma ho anche altri interessi come giocare a tris.

Vedi il posizionamento di componenti non vocali nella generazione del parlato.

In questo modo, puoi creare uso di questo testo gratuito e potente per il modello di generazione audio. Converti testo in parlato, clona voci, genera musica ed effetti sonori. Il processo è semplice e l’interfaccia Hugging Face lo rende ancora più facile da usare. Inoltre, puoi ospitarlo sul tuo server o PC se hai i giusti requisiti hardware.

Parole di chiusura:

Se stai cercando uno strumento AI gratuito che possa generare musica, parole ed effetti sonori dalla descrizione Bark è lo strumento numero uno là fuori per farlo. Con questo, puoi generare voci fuori campo per i tuoi video, podcast e persino audiolibri. Mi è piaciuto il fatto che sia multilingue e offra varie opzioni di configurazione per produrre un output perfetto.

Categories: IT Info