Ingat ketika Prisma adalah aplikasi pengeditan gambar”AI”terbaik di luar sana? Ya, kita pasti sudah jauh sejak saat itu. Dengan munculnya generator gambar AI berbasis cepat seperti DALL-E dan Midjourney, membuat karya seni dan deepfake cukup banyak tersedia untuk semua orang di luar sana.
Tapi ada batasannya, kan? Setelah kebaruan awal meminta Midjourney untuk membayangkan berbagai petunjuk dan melihat apa yang dilontarkannya, semuanya menjadi agak membosankan. Atau setidaknya itu terjadi pada saya.
Energi Narsis?
Begini, saya seorang introvert, yang berarti saya tidak terlalu suka keluar. Tapi kau tahu apa yang aku suka? Memiliki foto diri saya di tempat-tempat yang mungkin tidak akan pernah saya kunjungi; heck, tempat-tempat yang tidak bisa saya kunjungi juga.
Tentu saja, saya ingin meminta alat AI untuk membuat gambar saya di berbagai situasi dan tempat. Namun, saya juga tidak ingin mengunggah gambar diri saya di situs web acak dengan harapan hasilnya bagus; dan saat itulah saya membaca tentang Dreambooth.
Permainan Dimulai…
Ternyata, orang-orang yang sangat pintar telah membawa hal-hal seperti Difusi Stabil kepada massa. Terlebih lagi, orang lain telah berkolaborasi dengan mereka dan memungkinkan siapa saja dengan kesabaran untuk membuat model Difusi Stabil mereka sendiri dan menjalankannya, sepenuhnya online.
Jadi meskipun saya memiliki M1 MacBook Air yang oleh tidak dimaksudkan untuk digunakan sebagai mesin pelatihan untuk model pembuatan gambar pembelajaran mendalam, saya dapat menjalankan notebook Google Colab dan melakukan semua itu di server Google — gratis!
Yang saya butuhkan hanyalah beberapa foto diri saya, dan hanya itu.
Melatih Generator Gambar AI saya
Melatih generator gambar Anda sendiri sama sekali tidak sulit. Ada sejumlah panduan yang tersedia online jika Anda memerlukan bantuan, dan pada dasarnya semuanya sangat mudah. Anda hanya perlu membuka notebook Colab, mengupload gambar, dan mulai melatih model. Semuanya terjadi cukup cepat.
Oke, jujur saja, pelatihan pembuat enkode teks terjadi cukup cepat, dalam waktu 5 menit. Namun, melatih UNet dengan parameter yang disetel ke default membutuhkan waktu yang cukup lama — mendekati 15-20 menit. Namun, mengingat fakta bahwa kami sebenarnya melatih model AI untuk mengenali dan dapat menggambar wajah saya, 20 menit sepertinya tidak terlalu lama.
Sementara pelatihan, ada banyak cara yang dapat Anda lakukan untuk menyesuaikan seberapa banyak Anda ingin melatih model Anda, dan apa yang saya pahami dari pengalaman membaca banyak orang online, adalah bahwa ada tidak ada strategi”satu ukuran untuk semua”yang nyata di sini. Namun, untuk kasus penggunaan dasar, nilai default tampaknya berfungsi dengan baik untuk kebanyakan orang, dan saya tetap menggunakannya juga. Sebagian karena saya tidak benar-benar memahami apa arti sebagian besar hal tersebut, dan sebagian karena saya tidak mau repot untuk mencoba melatih beberapa model dengan parameter pelatihan yang berbeda untuk melihat apa yang menghasilkan keluaran terbaik.
Lagi pula, saya hanya mencari generator gambar AI yang menyenangkan yang dapat membuat gambar saya setengah layak.
Melebihi Ekspektasi
Saya bukan ahli AI sama sekali. Namun, saya memahami bahwa melatih model difusi stabil pada notebook Google Colab dengan 8 jpeg dari diri saya yang dipangkas menjadi 512×512 piksel tidak akan menghasilkan sesuatu yang luar biasa.
Betapa salahnya saya.
Dalam upaya pertama saya menggunakan model yang saya latih, saya mulai dengan prompt sederhana yang bertuliskan”akshay”. Berikut adalah gambar yang dihasilkan.
Tidak bagus, bukan? Tapi itu juga tidak terlalu buruk, bukan?
Tapi kemudian saya mulai bermain dengan beberapa parameter yang tersedia di UI. Ada beberapa metode pengambilan sampel, ada langkah pengambilan sampel, Skala CFG, skrip, dan banyak lagi. Saatnya sedikit gila bereksperimen dengan berbagai petunjuk dan penyiapan untuk model.
Jelas, hasil dari gambar-gambar ini tidak sempurna, dan siapa pun yang telah melihat saya mungkin dapat mengatakan bahwa ini bukan gambar”saya”. Namun, mereka cukup dekat; dan saya bahkan tidak melatih model tersebut dengan sangat hati-hati.
Jika saya mengikuti panduan yang tak terhitung jumlahnya di Reddit dan di tempat lain di internet yang berbicara tentang cara Anda dapat meningkatkan pelatihan dan mendapatkan hasil yang lebih baik dari Dreambooth dan Stable Diffusion, gambar ini mungkin menjadi lebih realistis (dan bisa dibilang, lebih menakutkan).
Penghasil Gambar AI Ini Sangat Bagus
Begini, saya mendukung peningkatan dalam teknologi AI. Sebagai seorang jurnalis teknologi, saya telah mengikuti bidang AI yang dihadapi konsumen yang selalu berubah dan meningkat selama beberapa tahun terakhir, dan sebagian besar, saya sangat terkesan dan optimis.
Namun, melihat sesuatu seperti Dreambooth beraksi membuat saya bertanya-tanya tentang cara tidak etis di mana alat berbasis AI dan ML tersedia untuk siapa saja yang memiliki akses ke komputer dan internet.
Tidak diragukan lagi bahwa ada banyak aktor jahat di dunia. Sementara kasus penggunaan yang tidak bersalah dari teknologi yang mudah diakses seperti itu pasti ada, jika ada satu hal yang telah saya pelajari selama bertahun-tahun melaporkan teknologi, itu menempatkan produk ke tangan jutaan orang pasti akan menghasilkan banyak hasil yang tidak diinginkan.. Paling-paling, sesuatu yang tidak terduga, dan paling buruk sesuatu yang sangat menjijikkan.
Memiliki kemampuan untuk membuat gambar deepfake dari hampir semua orang selama Anda dapat mengambil 5 hingga 10 gambar wajah mereka, sangat berbahaya jika digunakan secara tidak benar. Pikirkan misinformasi, misrepresentasi, dan bahkan pornografi balas dendam — deepfake dapat digunakan dalam semua cara bermasalah ini.
Safeguard? Safegaurds apa?
Ini juga bukan hanya Dreambooth. Dalam dirinya sendiri, dan digunakan dengan baik, Dreambooth dan Stable Diffusion adalah alat luar biasa yang memungkinkan kita merasakan apa yang dapat dilakukan AI. Tapi tidak ada perlindungan nyata untuk teknologi ini dari apa yang saya alami sejauh ini. Tentu, itu tidak akan membiarkan Anda menghasilkan ketelanjangan langsung dalam gambar; setidaknya secara default. Namun, ada banyak ekstensi yang memungkinkan Anda melewati filter itu juga dan membuat hampir semua hal yang dapat Anda bayangkan, berdasarkan identitas siapa pun.
Bahkan tanpa ekstensi semacam itu, Anda dapat dengan mudah mendapatkan alat seperti ini untuk membuat citra orang yang berpotensi mengganggu dan merusak reputasi.
Terlebih lagi, dengan PC yang cukup kuat, seseorang dapat melatih model AI mereka sendiri tanpa perlindungan apa pun dan berdasarkan data pelatihan apa pun yang ingin mereka gunakan — yang berarti model yang dilatih akan membuat gambar yang dapat memberatkan dan berbahaya di luar imajinasi.
Deepfake bukanlah hal baru. Faktanya, ada banyak sekali video deepfake dan media online. Namun, hingga saat ini, membuat deepfake terbatas pada sejumlah kecil (walaupun masih banyak) orang yang ada di persimpangan”orang dengan perangkat keras yang mumpuni”, dan”pengetahuan teknis”.
Sekarang, dengan akses ke unit komputasi GPU gratis (penggunaan terbatas) di Google Colab dan ketersediaan alat seperti fast-dreambooth yang memungkinkan Anda melatih dan menggunakan model AI di server Google, jumlah orang sebanyak itu akan naik secara eksponensial. Mungkin sudah-itu menakutkan bagi saya, dan seharusnya begitu juga bagi Anda.
Apa yang Dapat Kita Lakukan?
Itulah pertanyaan yang harus kita tanyakan pada diri kita sendiri saat ini. Alat-alat seperti DALL-E, Midjourney, dan ya, Dreambooth dan Stable Diffusion, tentu mengesankan bila digunakan dengan kesopanan manusia biasa. AI meningkat pesat — Anda mungkin bisa mengetahuinya dengan melihat ledakan berita terkait AI dalam beberapa bulan terakhir.
Maka, inilah poin penting di mana kita perlu mencari cara untuk memastikan AI digunakan secara etis. Bagaimana kita bisa melakukan itu adalah pertanyaan yang saya tidak yakin saya punya jawabannya, tetapi saya tahu bahwa setelah menggunakan generator gambar AI fast-dreambooth, dan setelah melihat kemampuannya, saya takut betapa bagusnya itu. , bahkan tanpa berusaha terlalu keras.
3 Komentar
Tahun lalu, MSI meluncurkan Titan GT77 dengan Intel Core i9-12900HX dan GPU Laptop RTX 3080 Ti, dan ini adalah laptop gaming terkuat di muka bumi. Itu adalah pemukul berat terberat […]
Sudah beberapa bulan sejak seri iPhone 14 diluncurkan, dan telah ditetapkan dengan baik bahwa ini adalah tahun model Pro. Tetapi jika Anda berniat untuk menggunakan Pro berenda, jumlah yang harus ditanggung […]
Wondershare telah mengembangkan beberapa perangkat lunak dan alat terbaik untuk menyederhanakan hidup dan upaya kreatif kita selama beberapa tahun terakhir. Secara khusus, Wondershare Filmora telah menerima banyak penghargaan. Itu adalah penerima penghargaan Video Editing Leader […]