Penilaian Editor: Penilaian Pengguna:[Jumlah: 0 Purata: 0] @media(lebar min: 500px) { } @media(lebar min: 800px) { }

Bark ialah teks bebas dan sumber terbuka model AI penukar audio yang membolehkan anda menjana pertuturan, muzik dan kesan bunyi. Ia juga menyokong pengklonan suara yang boleh anda cuba. Pada masa ini, anda hanya boleh mencuba versi yang dihoskan pada Wajah Memeluk dan kemudian menganalisis outputnya. Jika anda mendapati ia berguna, maka anda boleh ambil kod sumbernya dan kemudian hoskannya di mana-mana yang anda suka.

Bark mungkin satu-satunya model AI yang tersedia di luar sana yang boleh menjana audio daripada teks. Malah Google telah mengumumkan satu model AI yang serupa sebentar tadi tetapi ia masih belum dilancarkan. Jadi, jika anda menggunakan AI terutamanya untuk penjanaan audio maka anda akan menyukai Bark. Ia menyokong gesaan kontekstual dengan konteks tambahan dan nota muzik supaya ia akan mengetahui perkara yang anda mahu lakukan. Anda juga boleh membuatnya menjana pertuturan dalam suara orang lain.

Anda juga boleh mengetahui lebih lanjut tentang Bark dalam urutan Twitter ini jika anda mahu.

AI membolehkan anda mencipta realistik suara, muzik, bunyi.

Tetapi kebanyakan alatan AI teks-ke-audio berharga sekitar $12/bulan.

Berikut ialah alat AI percuma untuk mula mencipta suara yang realistik hanya dengan teks: 👇

— Barsee 🐶 (@heyBarsee) 30 April 2023

Model AI Teks ke Audio Percuma untuk Menjana Pertuturan dan Muzik: Bark

Seperti yang telah saya nyatakan bahawa ia adalah sumber terbuka, anda boleh dengan cepat mengambilnya. kod sumber di sini atau lihat sahaja. Buat masa ini, ia mempunyai sokongan untuk 13 bahasa tetapi sokongan untuk lebih banyak bahasa akan datang tidak lama lagi dalam kemas kini kemudian. Beberapa bahasa sokongan yang terkenal dalam model ini ialah:

Bahasa Inggeris (en) ✅ Jerman (de) ✅ Sepanyol (es) ✅ Perancis (fr) ✅ Hindi (hi) ✅ Itali (it) ✅ Jepun (ja ) ✅ Korea (ko) ✅ Poland (pl) ✅ Portugis (pt) ✅ Rusia (ru) ✅ Turki (tr) ✅ Cina, dipermudahkan (zh) ✅

Kini, berikut ialah pautan kepada model yang dihoskan pada Hugging Face yang boleh anda cuba. Ia boleh menjadi perlahan dalam generasi, tetapi ia akan berfungsi. Ia adalah sejenis bukti konsep tetapi jika anda ingin menjalankannya dengan potensi penuh maka anda boleh mengambil kod sumber dan menjalankannya selepas mengikuti arahan pemasangan (memerlukan keperluan perkakasan berat). Antara muka Memeluk Wajah kelihatan seperti ini.

Masukkan gesaan dalam kotak, atau anda juga boleh menjalankan gesaan contoh yang diberikan di sana. Hanya pilih pembesar suara daripada senarai dan kemudian teruskan. Klik jana dan kemudian ia akan menghasilkan pertuturan output dalam beberapa saat.

Dengan cara yang sama, anda boleh menjana muzik atau kesan bunyi. Memandangkan penjanaan pertuturan adalah proses yang sama juga, jadi, anda boleh membezakan antara penjanaan pertuturan dan penjanaan muzik dengan menambah nota. Lihat contoh di bawah dan cara nota muzik dimasukkan ke dalamnya.

♪ Di dalam hutan, hutan yang hebat, singa menyalak malam ini ♪

Dalam input teks biasa, anda boleh masukkan beberapa simbol untuk menambah kesan tambahan seperti ketawa, berdehem, dsb. Berikut ialah senarai beberapa bunyi bukan pertuturan yang disokong yang boleh anda pilih untuk disertakan dalam ucapan akhir. Ia sedang dikemas kini setiap hari, dan anda juga boleh mengesyorkan sendiri dalam pelayan Discord Bark.

[ketawa] [ketawa] [mengeluh] [muzik] [terkejut] [berdehem] — atau … untuk teragak-agak

Contoh: Helo, nama saya Suno. Dan, eh-dan saya suka pizza. [ketawa]Tetapi saya juga mempunyai minat lain seperti bermain tic tac toe.

Lihat penempatan komponen bukan pertuturan dalam penjanaan pertuturan.

Dengan cara ini, anda boleh membuat penggunaan teks percuma dan berkuasa model penjanaan audio ini. Tukar teks kepada pertuturan, klon suara, jana muzik dan kesan bunyi. Prosesnya mudah dan antara muka Memeluk Wajah menjadikannya lebih mudah untuk digunakan. Selain itu, anda boleh mengehoskannya pada pelayan atau PC anda sendiri jika anda mempunyai keperluan perkakasan yang betul.

Kata penutup:

Jika anda sedang mencari alat AI percuma yang boleh menjana muzik, pertuturan dan kesan bunyi daripada penerangan Bark ialah alat nombor satu di luar sana untuk melakukannya. Dengan ini, anda boleh menjana alih suara untuk video, podcast dan juga buku audio anda. Saya menyukai fakta bahawa ia berbilang bahasa dan menawarkan pelbagai pilihan konfigurasi untuk menghasilkan output yang sempurna.

Categories: IT Info