Äskettäin Teslan itseohjautuvan ohjelmiston johtaja Ashok Elluswamy piti puheen CVPR 2022-konferenssissa. Puheessaan hän toi esiin monia Teslan Autopilot-järjestelmätiimin saavutuksista kuluneen vuoden aikana. Hän mainitsi hermoverkkomallin nimeltä Occupancy Networks. Hän mainitsi, että autonomisissa ajojärjestelmissä perinteisesti käytetyssä semanttisessa segmentoinnissa ja syvyystiedoissa on monia ongelmia. Esimerkiksi 2D:n muuntaminen 3D:ksi on vaikeaa, ja syvyystietojen arvio on epätarkka. Läsnäoloverkoston käytön jälkeen malli pystyy ennustamaan ajoneuvon ympärillä olevien esineiden viemän tilan.

Tämän perusteella ajoneuvo voi tehdä väistötoimia ilman, että sen tarvitsee tunnistaa, mikä este on. Ashok Elluswamy jopa vitsaili Twitterissä, että Teslan auto voi jopa välttää UFOja. Tämän tekniikan perusteella ajoneuvo näkee myös, onko ympäröivissä mutkissa esteitä, jotta se pystyy ohjaamaan suojaamatonta kuin ihmiskuljettaja. Lyhyesti sanottuna verkon käyttäminen parantaa merkittävästi Teslan itseohjautumiskykyä (L2). Teslan mukaan sen Autopilot-järjestelmä estää 40 kuljettajan virheestä johtuvaa kolaria päivässä.

Tunnistamalla ulkoisen ympäristön ja kuljettajan käyttöjärjestelmän ajoneuvo voi tunnistaa kuljettajan virheellisen toiminnan. Kuljettaja voi painaa kaasupoljinta väärään aikaan, jolloin auto pysähtyy ja jarruttaa automaattisesti. Toisin sanoen jotkin”jarruvika”-ongelmista, jotka ovat usein olleet esillä Kiinassa kuljettajan väärinkäytön vuoksi, ovat teknisesti rajoitettuja. Tesla on todella hyvä ajamaan teknistä kehitystä. Tässä ovat Ashok Elluswamyn puheen kohokohdat.

Tehokas puhdas visio-algoritmi – 2D-kuva 3D:ksi

Ashokin mukaan Tesla Autopilot-järjestelmä voi auttaa ajoneuvoa pitämään kaistaa ja seuraamaan ajoneuvoa , hidastuvuus ja kaarreajo jne. Näiden lisäksi Tesla Autopilot-järjestelmä tukee myös vakioturvaominaisuuksia. Se tukee hätäjarrutusta ja esteiden välttämistä, mikä voi estää useita törmäyksiä. Lisäksi vuodesta 2019 lähtien noin miljoona Teslaa on voinut käyttää edistyneempää navigointia moottoriteillä, tarkistaa viereisten kaistatietojen tiedot kaistanvaihdosten suorittamiseksi ja tunnistaa valtateiden sisään-ja poistumiset. Teslan Autopilot-järjestelmä voi myös pysäköidä automaattisesti parkkipaikoille, tunnistaa liikennevalot ja katumerkit sekä kääntyä oikealle välttääkseen esteitä, kuten autoja. Tällä hetkellä sadat tuhannet Teslan omistajat ovat vahvistaneet nämä ominaisuudet.

Järjestelmä tunnistaa ympäröivän ympäristön

Ashokin mukaan Tesla käyttää kahdeksaa 1,2 megapikselin kameraa, jotka voivat ottaa 360 asteen kuvia ympäröivästä ympäristöstä ja tuottaa keskimäärin 36 kuvaa sekunnissa. Teslan auto käsittelee sitten nämä tiedot ja suorittaa 144 biljoonaa toimintoa sekunnissa (TeraOPs/s). Nämä prosessit perustuvat kaikki puhtaasti visuaalisiin algoritmeihin ilman lidaria ja ultraäänitutkaa ja ilman teräväpiirtokarttoja.

Miten Tesla Autopilot-järjestelmä tunnistaa yleiset esteet?

Ashok väittää järjestelmä käyttää spatiaalista segmentointimenetelmää kohdatessaan yleisiä esteitä. Avaruuden segmentointimenetelmää käytettäessä järjestelmä merkitsee jokaisen tilan pikselin”ajokelpoiseksi”ja”ei-ajettavaksi”, ja sitten autonominen ajosiru käsittelee kohtauksen. Tässä menetelmässä on kuitenkin joitain ongelmia.

Kohteiden merkitseminen

Ensinnäkin järjestelmän merkitsemät objektipikselit ovat kaksiulotteisessa avaruudessa ja auton navigoimiseksi kolmiulotteisessa avaruudessa , kohteen pikselit on muutettava vastaaviksi ennustetuiksi arvoiksi kolmiulotteisessa avaruudessa. Siten Teslan järjestelmä voi luoda interaktiivisen fyysisen mallin ja hoitaa navigointitehtävät sujuvasti.

Kohteiden merkitseminen

Kun järjestelmä muuntaa objektin pikseleitä kaksiulotteisesta kuvasta kolmiulotteiseksi kuvaksi, sen on suoritettava kuva semanttinen segmentointi. Tämä prosessi tuottaa tarpeettomia kuvia tai tarpeettomia pikseleitä järjestelmään. Muutamalla pikselillä kuvan maatasolla voi olla valtava vaikutus sen määrittämiseen, kuinka tämä 2D-kuva muunnetaan 3D-kuvaksi. Siksi Tesla ei halua olla niin suurta pikseliä suunnittelussa.

Erilaiset esteet on myös arvioitava eri menetelmillä

Yleisesti ottaen kohteen syvyysarvo on yleisemmin käytetty. Joissakin skenaarioissa järjestelmä voi ennakoida esteet ensin. Toisessa skenaariossa järjestelmä voi myös havaita syvyyden kuvan pikseleissä, joten jokainen pikseli tuottaa jonkin verran syvyysarvoa.

Syvyyskartta (oikea puoli)

Kuitenkin vaikka tuloksena saatu syvyyskartta on erittäin kaunis, kun Ennusteiden tekemiseen syvyyskartalla tarvitaan vain kolme pistettä. Ja kun visualisoidaan nämä kolme pistettä, vaikka se näyttää hyvältä läheltä, ne myös muotoutuvat etäisyyden kasvaessa, ja näitä kuvia on vaikea jatkaa seuraavassa vaiheessa. Esimerkiksi seinät voivat vääntyä ja taipua. Maatason lähellä olevat kohteet määräytyvät myös harvemmilla pisteillä, minkä vuoksi järjestelmä ei pysty arvioimaan esteitä oikein suunnittelun aikana. Koska nämä syvyyskartat muunnetaan useiden kameroiden ottamista tasokuvista, on vaikeaa luoda identtistä estettä lopulta. Lisäksi järjestelmän on myös vaikea ennustaa esteen rajaa. Siksi Tesla keksi Occupancy Network-ratkaisun tämän ongelman ratkaisemiseksi.

Laske tilan käyttöaste objektin koodaamiseksi

Ashok esittelee käyttöverkoston ja paljastaa, että järjestelmä käsittelee kuvia 8 kamerasta ja laskee sitten kohteen tilankäyttöasteen. Tämän avulla se lopulta luo kaavion.

Luotu simuloitu kuva

Ja aina kun Tesla-auto liikkuu ajon aikana, järjestelmäverkko laskee uudelleen ympäröivien kohteiden tilan. Lisäksi järjestelmäverkko ei ainoastaan ​​laske joidenkin staattisten kohteiden, kuten puiden ja seinien, tilankäyttöastetta, vaan laskee myös dynaamisten kohteiden, mukaan lukien liikkuvien autojen, tilankäyttöasteen. Tämän jälkeen verkko tulostaa kuvan 3D-kuvana ja voi myös ennustaa tukkeutuneita kohteita. Näin ollen, vaikka auto lataa vain osittaisen ääriviivan kohteesta, käyttäjä voi erottaa kohteen selvästi.

Esteen tyypillä ei ole väliä – järjestelmä voi välttää törmäyksen

Ashok väittää myös, että säännölliset liike-tai matkaviestinverkot eivät pysty kertomaan esineiden tyyppiä, kuten onko kyseessä staattinen esine vai liikkuva ajoneuvo. Mutta ohjaustasolta kohteen tyypillä ei ole väliä. Miehittävä verkkomalli tarjoaa hyvän suojan verkon luokitusdilemmaa vastaan. Koska riippumatta siitä, mikä este on, järjestelmä ajattelee, että tämä osa tilasta on varattu ja liikkuu tietyllä nopeudella. Joissakin erikoisajoneuvoissa voi olla outoja ulkonemia, joita on vaikea mallintaa perinteisillä tekniikoilla. Järjestelmä käyttää kuutioita tai muita polygoneja edustamaan liikkuvia objekteja.

Tällä tavalla objekteja voidaan pursota mielivaltaisesti käyttämällä tätä paikkamerkkilähestymistapaa ilman monimutkaista verkkomaista topologiamallinnusta. Geometristen tietojen avulla voidaan päätellä tukos, kun ajoneuvo tekee suojaamattomia tai suojattuja käännöksiä. Geometriset tiedot edellyttävät ajoneuvokameroiden tunnistamien tietojen päättelemisen lisäksi myös tunnistamattomien tietojen päättämistä.

Ashok väittää, että kun Teslan ajoneuvo on käynnissä, sen saamien kuvien taustakäsittely on tarkempaa. Siten se voi luoda ristikkäisen ja tarkan kuvareitin (käyttäen NeRf:ää). Tämän avulla se tuottaa tarkempia kuvia NeRf-mallin ja 3D-tilan differentiaalisen renderoinnin avulla.

Törmäyksellä tarkoitetaan törmäystä, joka johtuu siitä, että kuljettaja painaa vahingossa kaasupoljinta jarrupoljtimena. Ashok sanoi, että kun kuljettaja vahingossa astui kaasupolkimen päälle jarruna, auto kiihtyisi ja aiheuttaisi törmäyksen. Tesla kuitenkin tunnistaisi ja pysäyttäisi kiihdytyksen automaattisesti ja jarruttaisi automaattisesti estääkseen törmäyksen.

Tesla AP alkaa estää autoa putoamasta jokeen

Suunnittele reittejä käyttöasteajoneuvojen läpi automaattisesti

Mutta saada auton tasainen jarruttaminen ja pysähtyminen voi kestää sekunteja tai minuutteja. Autolla ei myöskään välttämättä ole tarpeeksi aikaa tunnistaa esteitä ja tehdä laskelmia sen ollessa liikkeessä. Siksi Tesla käyttää tähän tarkoitukseen neuroverkkoja. varsinkin viime aikoina ilmenneiden monimutkaisempien piilevien skenaarioiden kanssa. Tesla Autopilot-tiimin tarvitsee vain saada tilaa edellisestä verkosta.

Ensin tilan käyttöaste koodataan superkompressoituun monikerroksiseen perceptroniin (MLP). Pohjimmiltaan tämä MLP on implisiittinen esitys siitä, voidaanko törmäyksiä välttää missä tahansa tietyssä kyselytilassa, ja tämä törmäysten välttämismenetelmä tarjoaa joitain takuita tietyn aikakehyksen sisällä. Törmäykset voidaan välttää esimerkiksi 2 sekuntia tai 4 sekuntia tai jonkin aikaa.

Johtopäätös: Tesla jatkaa autonomisen ajamisen tutkimista

Koska Tesla nosti autopilottitekniikan etualalle, autopilottiradalle on noussut suuri joukko seuraajia. Mutta Tesla on aina ollut alan eturintamassa, ja se on jatkuvasti tutkinut uusia autonomisen ajon menetelmiä. Tällä kertaa Tesla Autopilot-projektista vastaava henkilö toi uuden teknisen tulkinnan. Tietyssä määrin se näyttää meille myös etukäteen Teslan tulevan itseohjautuvan tekniikan kohokohdat. Teslan jatkuvan tutkimisen hengessä sen autonominen ajo johtaa jatkossakin koko automarkkinoita.