Anda tahu bagaimana, dalam filem, apabila terdapat gambar di komputer dan detektif yang berdiri di sebelah The Guy In The Chair berkata”bolehkah anda memperbesar dan meningkatkan plat nombor itu?”Teknologi itu kini nyata , terima kasih kepada Enjin AI terbaru Google.
Proses untuk melakukan ini sangat rumit dan sukar untuk dikuasai, kerana berdasarkan pada model penyebaran (dan beberapa matematik yang sangat maju) dan berusaha untuk menambah perincian pada gambar yang pada asalnya tidak ada di sana. Ini dilakukan dengan meneka dengan menggunakan gambar yang serupa dan merupakan teknik yang dijuluki oleh Google sebagai sintesis gambar semula jadi, dan dalam hal ini, resolusi super gambar.
Jelas, anda memulakan dengan gambar kecil dan piksel (seperti gambar di sebelah kiri setiap set gambar di atas) dan diakhiri dengan gambar beresolusi yang jauh lebih tinggi yang bukan sahaja kelihatan lebih tajam tetapi kelihatan nyata pada mata manusia, walaupun itu bukan 100% tepat dengan yang asli. Untuk menyelesaikan tugas itu, Google menggunakan dua alat AI baru: Resolusi Super melalui Penyempurnaan Berulang (SR3) dan Model Diffusion Cascaded (CDM).
Yang pertama, SR3, menambah bunyi pada gambar (ini kelihatan serupa dengan statis atau salji yang anda lihat di skrin TV apabila isyarat lemah), kemudian membalikkan prosesnya. Ia menggunakan pangkalan data gambar yang besar dan serangkaian pengiraan kebarangkalian untuk memetakan seperti apa versi gambar yang beresolusi rendah, yang mana Penyelidik Google Chitwan Saharia akan lebih mendalam dengan di sini .
“Model difusi berfungsi dengan merosakkan data latihan dengan menambahkan bunyi Gaussian secara progresif, perlahan-lahan menghapuskan butiran dalam data sehingga menjadi kebisingan yang murni, dan kemudian melatih rangkaian saraf untuk membalikkan proses rasuah ini,” dijelaskan Saharia.
Alat kedua, CDM, menggunakan”saluran paip”pelbagai model penyebaran (termasuk SR3) dapat diarahkan untuk menghasilkan peningkatan beresolusi tinggi. Alat ini menghasilkan gambar model peningkatan yang lebih besar menggunakan simulasi yang dikira dengan teliti berdasarkan kebarangkalian lanjutan, yang Google menerbitkan kertas penyelidikan on.
Hasil akhirnya? Ketika penyelidikan menyampaikan gambar akhir kepada orang-orang dalam ujian, mereka memilih wajah yang dihasilkan disalah anggap sebagai wajah sebenar kira-kira separuh masa. Walaupun kadar 50% mungkin tidak berjaya, ia sesuai dengan apa yang kita harapkan dengan algoritma yang sempurna. Google mengatakan kaedah ini menghasilkan hasil yang lebih baik daripada pilihan peningkatan gambar lain, termasuk rangkaian lawan generatif yang menggunakan rangkaian neural yang bersaing untuk menyempurnakan imej.
Google mengatakan bahawa pihaknya berhasrat untuk berbuat lebih banyak dengan enjin AI ini, dan teknologi yang berkaitan dengannya, di luar ruang lingkup peningkatan imej, seperti bidang pemodelan kebarangkalian yang lain. Walaupun teknologi”zoom dan tingkatkan”ini akan memudahkan untuk melakukan perkara seperti foto lama kelas atas, ia pasti dapat menyangkal potensi, seperti, juga, memperbesar dan meningkatkan foto atau plat nombor atau apa sahaja.
melalui Makluman Sains