Zaman kecerdasan buatan sudah tiba, dan Generative AI memainkan peranan penting dalam membawa kemajuan yang belum pernah berlaku sebelum ini kepada teknologi harian. Terdapat beberapa alat AI percuma yang boleh membantu anda menghasilkan imej, teks, muzik, video dan banyak lagi yang luar biasa dalam beberapa saat. Pengisian AI Generatif Adobe dalam Photoshop dan keupayaan menakjubkan Midjourney sememangnya mengejutkan kami. Tetapi, apakah sebenarnya Generative AI dan bagaimana ia memacu inovasi yang begitu pesat? Untuk mengetahui lebih lanjut, ikuti penjelasan terperinci kami tentang Generative AI.

Jadual Kandungan

Definisi: Apakah Generative AI?

Seperti namanya, Generative AI bermaksud sejenis teknologi AI yang boleh menjana kandungan baharu berasaskan pada data yang telah dilatih. Ia boleh menjana teks, imej, audio, video dan data sintetik. AI Generatif boleh menghasilkan pelbagai output berdasarkan input pengguna atau apa yang kami panggil”prompt”. Generatif AI pada asasnya ialah subbidang pembelajaran mesin yang boleh mencipta data baharu daripada set data tertentu.

Jika model telah dilatih pada volum teks yang besar, ia boleh menghasilkan gabungan baharu teks bunyi semula jadi. Lebih besar data, lebih baik outputnya. Jika set data telah dibersihkan sebelum latihan, anda mungkin akan mendapat respons yang bernuansa.

OpenAI Playground

Begitu juga, jika anda telah melatih model dengan korpus besar imej dengan penandaan imej, kapsyen dan banyak contoh visual, model AI boleh belajar daripada contoh ini dan melaksanakan pengelasan dan penjanaan imej. Sistem canggih AI yang diprogramkan untuk belajar daripada contoh dipanggil rangkaian saraf.

Maksudnya, terdapat pelbagai jenis model AI Generatif. Ini ialah Generative Adversarial Networks (GAN), Variational Autoencoder (VAE), Generative Pretrained Transformers (GPT), model Autoregressive dan banyak lagi. Kami akan membincangkan secara ringkas model generatif ini di bawah.

Pada masa ini, model GPT telah menjadi popular selepas keluaran GPT-4/3.5 (ChatGPT), PaLM 2 (Google Bard), GPT-3 (DALL – E), LLaMA (Meta), Resapan Stabil dan lain-lain. Semua antara muka AI mesra pengguna ini dibina pada seni bina Transformer. Jadi dalam penjelasan ini, kami akan memberi tumpuan terutamanya kepada Generatif AI dan GPT (Generative Pretrained Transformer).

Apakah Jenis-Jenis Model AI Generatif yang Berbeza?

Di antara semua model AI Generatif, GPT digemari ramai, tetapi mari kita mulakan dengan GAN (Rangkaian Adversarial Generatif) . Dalam seni bina ini, dua rangkaian selari dilatih, yang mana satu digunakan untuk menjana kandungan (dipanggil penjana) dan satu lagi menilai kandungan yang dihasilkan (dipanggil diskriminator).

Pada asasnya, matlamatnya adalah untuk menggabungkan dua rangkaian saraf antara satu sama lain untuk menghasilkan hasil yang mencerminkan data sebenar. Model berasaskan GAN kebanyakannya digunakan untuk tugas penjanaan imej.

GAN (Generative Adversarial Network)/Sumber: Google

Seterusnya, kami mempunyai Variational Autoencoder (VAE), yang melibatkan proses pengekodan, pembelajaran, penyahkodan , dan menjana kandungan. Contohnya, jika anda mempunyai imej anjing, ia menerangkan pemandangan seperti warna, saiz, telinga dan banyak lagi, dan kemudian mengetahui jenis ciri yang ada pada anjing. Selepas itu, ia mencipta semula imej kasar menggunakan perkara utama yang memberikan imej yang dipermudahkan. Akhirnya, ia menjana imej akhir selepas menambah lebih banyak variasi dan nuansa.

Beralih ke model Autoregresif, ia hampir dengan model Transformer tetapi kurang perhatian diri. Ia kebanyakannya digunakan untuk menjana teks dengan menghasilkan urutan dan kemudian meramalkan bahagian seterusnya berdasarkan jujukan yang telah dihasilkannya setakat ini. Seterusnya, kami juga mempunyai Aliran Normalisasi dan Model berasaskan Tenaga. Tetapi akhirnya, kita akan bercakap tentang model berasaskan Transformer yang popular secara terperinci di bawah.

Apakah Model Transformer Pralatihan Generatif (GPT)

Sebelum seni bina Transformer tiba, Recurrent Rangkaian Neural (RNN) dan Rangkaian Neural Konvolusi (CNN) seperti GAN dan VAE digunakan secara meluas untuk AI Generatif. Pada 2017, penyelidik yang bekerja di Google mengeluarkan kertas maniPerhatian adalah semua yang anda perlukan” (Vaswani, Uszkoreit, et al., 2017) untuk memajukan bidang AI Generatif dan membuat sesuatu seperti model bahasa besar (LLM).

Google kemudiannya mengeluarkan model BERT (Perwakilan Pengekod Dua Arah daripada Transformers) pada 2018 melaksanakan seni bina Transformer. Pada masa yang sama, OpenAI mengeluarkan model GPT-1 pertamanya berdasarkan seni bina Transformer.

Sumber: Marxav/commons.wikimedia.org

Jadi apakah bahan utama dalam seni bina Transformer yang menjadikannya kegemaran Generatif AI? Oleh kerana kertas itu diberi tajuk yang betul, ia memperkenalkan perhatian diri, yang tiada dalam seni bina rangkaian saraf terdahulu. Maksudnya ialah ia pada dasarnya meramalkan perkataan seterusnya dalam ayat menggunakan kaedah yang dipanggil Transformer. Ia memberi perhatian yang teliti kepada perkataan jiran untuk memahami konteks dan mewujudkan hubungan antara perkataan.

Melalui proses ini, Transformer membangunkan pemahaman yang munasabah tentang bahasa dan menggunakan pengetahuan ini untuk meramalkan perkataan seterusnya dengan pasti. Keseluruhan proses ini dipanggil mekanisme Perhatian. Walau bagaimanapun, perlu diingat bahawa LLM secara hinanya dipanggil Burung Nuri Stochastic (Bender, Gebru, et al., 2021) kerana model tersebut hanya meniru perkataan rawak berdasarkan keputusan dan corak kebarangkalian yang telah dipelajarinya. Ia tidak menentukan perkataan seterusnya berdasarkan logik dan tidak mempunyai sebarang pemahaman yang tulen tentang teks.

Mengenai istilah”pralatih”dalam GPT, ini bermakna model itu telah telah dilatih mengenai sejumlah besar data teks sebelum menggunakan mekanisme perhatian. Dengan pra-latihan data, ia mempelajari apa itu struktur ayat, pola, fakta, frasa, dll. Ia membolehkan model mendapat pemahaman yang baik tentang cara sintaks bahasa berfungsi.

Bagaimana Google dan OpenAI Pendekatan Generatif AI?

Kedua-dua Google dan OpenAI menggunakan model berasaskan Transformer dalam Google Bard dan ChatGPT, masing-masing. Walau bagaimanapun, terdapat beberapa perbezaan utama dalam pendekatan. Model PaLM 2 terbaharu Google menggunakan pengekod dwiarah (mekanisme perhatian kendiri dan rangkaian neural suapan ke hadapan), yang bermaksud ia menimbang dalam semua perkataan sekeliling. Ia pada asasnya cuba memahami konteks ayat dan kemudian menjana semua perkataan sekaligus. Pendekatan Google adalah untuk meramalkan perkataan yang hilang dalam konteks tertentu.

Google Bard

Sebaliknya, OpenAI’s ChatGPT memanfaatkan seni bina Transformer untuk meramalkan perkataan seterusnya dalam urutan – dari kiri ke kanan. Ia adalah model satu arah yang direka untuk menghasilkan ayat yang koheren. Ia meneruskan ramalan sehingga ia menghasilkan ayat atau perenggan yang lengkap. Mungkin, itulah sebabnya Google Bard dapat menjana teks dengan lebih pantas daripada ChatGPT. Namun begitu, kedua-dua model bergantung pada seni bina Transformer pada teras mereka untuk menawarkan bahagian hadapan AI Generatif.

Aplikasi Generatif AI

Kita semua tahu bahawa Generative AI mempunyai aplikasi yang besar bukan sahaja untuk teks, tetapi juga untuk imej, video, penjanaan audio dan banyak lagi. Chatbot AI seperti ChatGPT, Google Bard, Bing Chat, dsb. memanfaatkan Generative AI. Ia juga boleh digunakan untuk autolengkap, ringkasan teks, pembantu maya, terjemahan, dll. Untuk menjana muzik, kami telah melihat contoh seperti Google MusicLM dan baru-baru ini Meta mengeluarkan MusicGen untuk penjanaan muzik.

ChatGPT

Selain itu, daripada DALL-E 2 kepada Stable Diffusion, semuanya menggunakan Generative AI untuk mencipta imej realistik daripada huraian teks. Dalam penjanaan video juga, model Runway Gen-1, StyleGAN 2 dan BigGAN bergantung pada Generative Adversarial Networks untuk menjana video seperti hidup. Selanjutnya, Generative AI mempunyai aplikasi dalam generasi model 3D dan beberapa model popular ialah DeepFashion dan ShapeNet.

Imej Dijana oleh Midjourney

Bukan itu sahaja, Generative AI boleh menjadi sangat membantu dalam penemuan dadah juga. Ia boleh mereka bentuk ubat baru untuk penyakit tertentu. Kami telah melihat model penemuan dadah seperti AlphaFold, yang dibangunkan oleh Google DeepMind. Akhir sekali, Generative AI boleh digunakan untuk pemodelan ramalan untuk meramalkan peristiwa masa depan dalam kewangan dan cuaca.

Batasan AI Generatif

Walaupun AI Generatif mempunyai keupayaan yang besar, ia bukan tanpa sebarang kegagalan. Pertama sekali, ia memerlukan korpus data yang besar untuk melatih model. Bagi kebanyakan syarikat permulaan kecil, data berkualiti tinggi mungkin tidak tersedia dengan mudah. Kami telah melihat syarikat seperti Reddit, Stack Overflow dan Twitter menutup akses kepada data mereka atau mengenakan bayaran yang tinggi untuk akses tersebut. Baru-baru ini, Arkib Internet melaporkan bahawa tapak webnya tidak dapat diakses selama sejam kerana beberapa pemula AI mula memalu tapak webnya untuk data latihan.

Selain itu, model AI Generatif juga telah dikritik hebat kerana kekurangan kawalan dan berat sebelah. Model AI yang dilatih mengenai data yang condong daripada internet boleh mewakili sebahagian daripada komuniti secara berlebihan. Kami telah melihat bagaimana penjana foto AI kebanyakannya memaparkan imej dalam ton kulit yang lebih cerah. Kemudian, terdapat isu besar video palsudan penjanaan imej menggunakan model Generatif AI. Seperti yang dinyatakan sebelum ini, model AI Generatif tidak memahami makna atau kesan perkataan mereka dan biasanya meniru output berdasarkan data yang telah dilatih.

Kemungkinan besar walaupun usaha terbaik dan penjajaran, maklumat salah, penjanaan deepfake, jailbreaking dan cubaan pancingan data yang canggih menggunakan keupayaan bahasa semula jadi yang meyakinkan, syarikat akan menghadapi kesukaran untuk menjinakkan Generatif Batasan AI.

Tinggalkan ulasan

RTX 4060 Ti akhirnya di sini, tiba dengan asas RTX 4060 pada titik harga yang cukup menarik untuk membuatkan pemain mempertimbangkan untuk menaik taraf kad grafik mereka. Tetapi patutkah anda? Kami akan mendalami dan membandingkan RTX 4060 […]

Terdapat banyak perdebatan di internet tentang AR (realiti tambahan) vs VR (realiti maya), jadi saya tidak akan menambah bahan api kepada kebakaran, tetapi salah satu perkara yang kami perasan semasa menggunakan Nreal Air ialah VR […]

Terdapat beberapa pilihan reka bentuk yang boleh dipersoalkan dalam Redfall, gabungan formula Arkane yang terkenal separuh masak. Saya suka permainan yang dibuat oleh Arkane Studios, dengan Dishonored menjadi tajuk yang saya lawati semula dari semasa ke semasa untuk permainan kemunculannya yang unik. Dan […]

Categories: IT Info