Google

Tiedät miten, elokuvissa, kun tietokoneessa on kuva ja The Guy In The Chairin vieressä seisova etsivä sanoo:”Voitko suurentaa ja parantaa rekisterikilpiä?”Tämä tekniikka on nyt todellinen , kiitos Googlen uusimmat tekoälymoottorit.

Prosessi on erittäin monimutkainen ja vaikea hallita, koska ne perustuvat diffuusiomallit (ja joitakin vakavasti edistyneitä matematiikkaa) ja pyrkivät lisäämään kuvaan yksityiskohtia, joita ei alun perin ollut. Tämä tehdään arvaamalla käyttämällä samankaltaisia ​​kuvia, ja tämä on tekniikka, jonka Google kutsui luonnolliseksi kuvasynteesiksi ja tässä tapauksessa kuvien huipputarkkuudeksi.

On selvää, että aloitat pienellä ja pikselitetyllä kuvalla (kuten kuvia jokaisen yllä olevan kuvasarjan vasemmalla puolella) ja lopulta saadaan paljon korkeamman resoluution kuva, joka näyttää paitsi terävämmältä myös todelliselta ihmissilmälle, vaikka se ei olisikaan 100% tarkka vastaus alkuperäiseen. Saadakseen työn päätökseen Google käytti kahta uutta tekoälytyökalua: Supertarkkuus toistuvan hienosäädön kautta (SR3) ja Cascaded Diffusion-mallit (CDM).

Ensimmäinen, SR3, lisää kuvaan kohinaa (tämä muistuttaa staattista tai lunta, joka näkyy television kuvaruudulla, kun signaali on heikko), ja käännä prosessi sitten päinvastaiseksi. Se kartoittaa suuren kuvakannan ja joukon todennäköisyyslaskelmia, miltä kuvan matalan resoluution versio näyttää, ja Googlen tutkija Chitwan Saharia syvenee tätä .

selitetty Saharia.

Toinen työkalu, CDM, käyttää”putkistoja”, joiden avulla eri diffuusiomallit (mukaan lukien SR3) voidaan ohjata tuottamaan korkean resoluution päivitykset. Tämä työkalu tekee suurempia kuvia parannusmalleista käyttämällä tarkasti laskettuja simulaatioita, jotka perustuvat kehittyneisiin todennäköisyyksiin. Google julkaisi tutkimuspaperin päällä.

Lopputulos? Kun tutkimus esitteli valmiit kuvat ihmisille testissä, he valitsivat, että luodut kasvot sekoitettiin todellisiin kasvoihin noin puolet ajasta. Vaikka 50 prosentin korko ei ehkä kuulosta onnistuneelta, se on yhdenmukainen sen kanssa, mitä voimme odottaa täydellisellä algoritmilla. Googlen mukaan tämä menetelmä tuottaa parempia tuloksia kuin muut kuvanparannusvaihtoehdot, mukaan lukien generatiiviset vastustusverkot, jotka käyttävät kilpailevia hermoverkkoja kuvan parantamiseen.

Google sanoo aikovansa tehdä enemmän näillä tekoälymoottoreilla ja niihin liittyvillä tekniikoilla kuvan parannuksen ulkopuolella, kuten muilla todennäköisyysmallinnuksen aloilla. Ja vaikka tämä”zoomaa ja paranna”-tekniikka helpottaa esimerkiksi kalliiden vanhojen valokuvien tekemistä, sillä on varmasti kieltämättä myös mahdollisuuksia, kuten valokuvan tai rekisterikilven lähentäminen ja parantaminen.

Science Alertin kautta