Pada tahun 2023, Anda tidak dapat melewatkan pembicaraan tentang AI Generatif saat membahas teknologi. Baik itu alat pengkodean AI, LLM lokal, atau generator gambar AI, teknologinya telah menginvasi hampir semua hal dan perusahaan dengan cepat beradaptasi dengan teknologi baru. ElevenLabs adalah salah satu perusahaan yang berspesialisasi dalam sintesis ucapan dan kloning suara menggunakan AI. Anda dapat menggunakan AI ElevenLabs untuk menghasilkan ucapan alami dari teks dan mengkloning suara Anda dengan akurasi yang nyaris sempurna. Jadi ikuti tutorial ini dan pelajari cara melakukannya.

Daftar Isi

Cara Menggunakan AI ElevenLabs untuk Menghasilkan Pidato Alami dari Teks

ElevenLabs gratis digunakan untuk pengguna individu. Di bawah tingkat gratis, Anda dapat menghasilkan ucapan dari teks hingga 10.000 karakter dalam sebulan. Anda juga dapat membuat ucapan dalam berbagai bahasa dan aksen. Yang mengatakan, inilah cara kerja alat AI ini:

1. Kunjungi situs web ElevenLabs (kunjungi) dan klik “Daftar” untuk membuat akun gratis.

2. Setelah mendaftar, Anda akan diarahkan ke halaman Sintesis Pidato. Di sini, di Setelan, Anda dapat melihat pratinjau berbagai suara dan memilih suara pilihan Anda.

3. Anda juga dapat memilih model audio tepat di bawah ini. Jika teks Anda dalam bahasa Inggris, pilih Eleven Monolingual v1. Jika teks Anda dalam bahasa lain, termasuk Inggris, Jerman, Hindi, Spanyol, Italia, Prancis, Portugis, atau Polandia, pilih “Eleven Multilingual v1” di sini.

4. Terakhir, masukkan teks di bawah dan klik “Hasilkan” agar AI ElevenLabs mengonversi teks Anda menjadi ucapan.

5. Di sini, saya membuat pidato dari contoh teks dengan suara Sam. Anda dapat mengeklik tombol “Unduh” untuk mendapatkan ucapan yang dihasilkan dalam format MP3.

6. Anda juga dapat memasukkan teks dalam bahasa yang berbeda dan dapat menghasilkan ucapan dengan sempurna. Pastikan untuk memilih model “Multibahasa” dari menu drop-down.

7. Anda juga dapat mengkloning suara Anda menggunakan AI ElevenLabs, yang telah kami tunjukkan di bawah ini. Namun, ada pustaka sampel suara dalam aksen berbeda yang dapat Anda tambahkan dari Perpustakaan Suara.

8. Klik “Tambahkan ke VoiceLab” di samping ucapan pilihan Anda. Misalnya, di sini saya menambahkan suara laki-laki muda dengan aksen Inggris.

9. Sekarang, cukup pilih suara dari menu tarik-turun dan buat ucapan. Kamu selesai.

Cara Menggunakan ElevenLabs AI untuk Mengkloning Suara Anda

Anda mungkin pernah melihat orang-orang di Instagram dan TikTok menggunakan kloning suara untuk mendapatkan figur terkenal seperti Obama, Drake, dan banyak orang lain mengatakan hal-hal acak. ElevenLabs dulu menawarkan Kloning Suara secara gratis, tetapi sekarang Anda perlu membayar $5 untuk membuat hingga 10 suara khusus. Jika Anda tidak ingin membayar, Anda dapat menggunakan PlayHT (kunjungi) untuk menggandakan suara Anda secara gratis. Pada artikel ini, saya akan menggunakan AI ElevenLabs untuk mengkloning suara saya.

1. Untuk mengkloning suara Anda dengan ElevenLabs AI, klik”Voice Lab”di bagian atas. Setelah itu, klik Tambahkan Suara Generatif atau Kloning.

2. Selanjutnya, klik Kloning Suara Instan.

3. Di sini, beri nama untuk suara Anda. Setelah itu, unggah rekaman audio Anda. Pastikan rekaman tidak memiliki suara latar yang keras. Disarankan untuk mengunggah setidaknya 5 menit audio untuk sintesis ucapan yang lebih baik. Tulis deskripsi di bawah dan klik tombol “Tambahkan Suara”.

4. Setelah beberapa detik, suara Anda akan dikloning dan siap digunakan. Klik “Gunakan” untuk mengonversi teks menjadi ucapan dengan langsung menggunakannya.

5. Di sini, pastikan suara Anda dipilih di menu drop-down. Sekarang, tambahkan teks Anda, dan klik Buat. Butuh beberapa detik untuk menyintesis ucapan Anda dan menghasilkan audio. Anda sekarang dapat mengunduh audio juga.

Menurut pendapat saya, AI ElevenLabs tidak melakukan pekerjaan yang baik dalam mengkloning suara saya meskipun mengupload file audio berdurasi 5 menit. Mungkin, saya perlu menambahkan lebih banyak sampel audio dan melatih modelnya lagi. Atau, bisa jadi karena model AI mengirimkan keluaran dalam bahasa Inggris (AS) alih-alih melokalkan aksen untuk India. Juga, dalam sampel audio saya, ada beberapa kebisingan latar belakang yang mungkin mengurangi kualitasnya. Namun demikian, ini adalah proyek AI yang menarik, dan kami akan melacak semua kemajuan baru dalam sintesis ucapan.

Tinggalkan komentar

RTX 4060 Ti akhirnya tiba, hadir dengan basis RTX 4060 dengan harga yang cukup menarik untuk membuat gamer mempertimbangkan untuk meningkatkan kartu grafis mereka. Tapi haruskah kamu? Kami akan mendalami dan membandingkan RTX 4060 […]

Ada banyak perdebatan di internet tentang AR (augmented reality) vs VR (virtual reality), jadi saya tidak akan menambahkan bahan bakar lagi ke api, tetapi salah satu hal yang kami perhatikan saat menggunakan Nreal Air adalah bahwa VR […]

Ada beberapa pilihan desain yang dipertanyakan di Redfall, campuran dari formula Arkane setengah matang yang terkenal. Saya suka game yang dibuat oleh Arkane Studios, dengan Dishonored menjadi judul yang saya kunjungi kembali sesekali karena gameplay uniknya yang muncul. Dan […]

Categories: IT Info