Mga Rating ng Editor: Mga Rating ng User:[Kabuuan: 0 Average: 0] @media(min-width: 500px) { } @media(min-width: 800px) { }

Bark ay isang libre at open-source na text to audio converter AI model na nagbibigay-daan sa iyong bumuo ng speech, musika, at sound effects. Sinusuportahan pa nito ang voice cloning na maaari mong subukan. Sa ngayon, maaari mo lamang subukan ang bersyon na naka-host sa Hugging Face at pagkatapos ay suriin ang output nito. Kung sa tingin mo ay kapaki-pakinabang ito, maaari mo lamang kunin ang source code nito at pagkatapos ay i-host ito kahit saan mo gusto.

Ang Bark ay marahil ang tanging AI model na available doon na makakabuo ng audio mula sa text. Kahit na ang Google ay nag-anunsyo ng isang katulad na modelo ng AI kanina ngunit iyon ay ilulunsad pa. Kaya, kung gumagamit ka ng AI lalo na para sa pagbuo ng audio, magugustuhan mo ang Bark. Sinusuportahan nito ang mga contextualized na prompt na may karagdagang konteksto at mga tala ng musika upang malaman nito kung ano ang gusto mong gawin. Magagawa mo rin itong makabuo ng pananalita sa boses ng ibang tao.

Maaari ka ring matuto nang higit pa tungkol sa Bark sa Twitter thread na ito kung gusto mo.

Pinapayagan ka ng AI na lumikha ng makatotohanang mga boses, musika, mga tunog.

Ngunit ang karamihan sa mga text-to-audio AI tool ay nagkakahalaga ng humigit-kumulang $12/buwan.

Narito ang isang libreng AI tool upang simulan ang paglikha ng mga makatotohanang boses gamit lamang ang text: πŸ‘‡

β€” Barsee 🐢 (@heyBarsee) Abril 30, 2023

Libreng Teksto sa Audio AI Model para Bumuo ng Pagsasalita at Musika: Bark

Tulad ng nabanggit ko na na ito ay open source, mabilis mong makukuha ang source code dito o tingnan lang ito. Sa ngayon, mayroon itong suporta para sa 13 mga wika ngunit ang suporta para sa higit pang mga wika ay paparating na sa mga susunod na update. Ilan sa mga kilalang sinusuportahang wika sa modelong ito ay:

English (en) βœ… German (de) βœ… Spanish (es) βœ… French (fr) βœ… Hindi (hi) βœ… Italian (it) βœ… Japanese (ja) ) βœ… Korean (ko) βœ… Polish (pl) βœ… Portuguese (pt) βœ… Russian (ru) βœ… Turkish (tr) βœ… Chinese, pinasimple (zh) βœ…

Ngayon, narito ang link sa modelo na naka-host sa Hugging Face na maaari mong subukan. Maaari itong maging mabagal sa henerasyon, ngunit gagana ito. Ito ay isang uri ng patunay ng konsepto ngunit kung nais mong patakbuhin ito sa buong potensyal nito, maaari mong kunin ang source code at patakbuhin ito pagkatapos sundin ang mga tagubilin sa pag-install (kinakailangan ang mabibigat na kinakailangan sa hardware). Ang Hugging Face interface ay ganito ang hitsura.

Ilagay ang prompt sa kahon, o maaari mo ring patakbuhin ang halimbawang prompt na ibinigay doon. Pumili lang ng speaker mula sa listahan at pagkatapos ay magpatuloy. I-click ang bumuo at pagkatapos ay gagawa ito ng output na pananalita sa loob ng ilang segundo.

Sa parehong paraan, maaari kang bumuo ng musika o mga sound effect. Dahil ang pagbuo ng pagsasalita ay pareho din ang proseso, kaya, maaari mo lamang makilala ang pagitan ng pagbuo ng pagsasalita at pagbuo ng musika sa pamamagitan ng pagdaragdag ng mga tala. Tingnan ang halimbawa sa ibaba at kung paano ipinapasok dito ang mga music note.

β™ͺ Sa gubat, sa makapangyarihang gubat, tumatahol ang leon ngayong gabi β™ͺ

Sa normal na text input, maaari mong maglagay ng ilang simbolo upang magdagdag ng mga karagdagang epekto gaya ng pagtawa, pag-clear ng lalamunan, atbp. Narito ang listahan ng ilang sinusuportahang mga tunog na hindi nagsasalita na maaari mong piliing isama sa huling pagsasalita. Ang mga ito ay ina-update araw-araw, at maaari mo ring irekomenda ang sarili mo sa Discord server ng Bark.

[laughter] [laughs] [sighs] [music] [gasps] [clears throat] β€”Β oΒ …Β para sa mga pag-aalinlangan

Isang halimbawa: Kumusta, ang pangalan ko ay Suno. At, uh β€” at gusto ko ng pizza. [laughs]Ngunit mayroon din akong iba pang mga interes tulad ng paglalaro ng tic tac toe.

Tingnan ang paglalagay ng mga bahaging hindi nagsasalita sa pagbuo ng pagsasalita.

Sa ganitong paraan, makakagawa ka paggamit nitong libre at malakas na text to audio generation model. I-convert ang text sa speech, i-clone ang mga boses, bumuo ng musika, at sound effects. Ang proseso ay madali at ang Hugging Face interface ay ginagawang mas madaling gamitin. Gayundin, maaari mo itong i-host sa iyong sariling server o PC kung mayroon kang tamang mga kinakailangan sa hardware.

Mga pangwakas na salita:

Kung naghahanap ka ng libreng tool sa AI na maaaring bumuo ng musika, pananalita, at mga sound effect mula sa paglalarawan ang Bark ay ang numero unong tool sa labas upang gawin ito. Sa pamamagitan nito, makakabuo ka ng mga voiceover para sa iyong mga video, podcast, at kahit na mga audio book. Nagustuhan ko ang katotohanang iyon na ito ay multilingual at nag-aalok ng iba’t ibang mga opsyon sa pagsasaayos upang makagawa ng perpektong output.

Categories: IT Info