OpenAI:n kehittämä AI-kielimalli ChatGPT on tehnyt aaltoja teknologiamaailmassa. Kaikkialla maailmassa ihmiset ovat vaikuttuneita sen kyvystä luoda ihmisen kaltaisia ​​vastauksia tekstikehotteisiin. Mallin nopea laajeneminen on kuitenkin herättänyt huolta mahdollisesta grafiikkasuoritusyksiköiden (GPU) pulasta. Nämä ovat välttämättömiä koulutuksessa ja suurten kielimallien, kuten ChatGPT:n, käyttämisessä.

Fortune-lehden mukaan OpenAI:n toimitusjohtaja Sam Altman paljasti yksityisessä tapaamisessa, että GPU:n vakava puute esti ChatGPT:n etenemisen. Raportin mukaan Altman tapasi toukokuussa useita sovelluskehittäjiä ja startup-yritysten johtajia. Lontoossa toimivan AI-startup-yrityksen Humanloopin toimitusjohtaja Raza Habib sanoi twiitissä, että Altman uskoo, että OpenAI:sta puuttuu tarpeeksi grafiikkasuorituksia, mikä on viivästyttänyt monia yrityksiä ChatGPT:n optimoimiseksi.

Miksi ChatGPT:llä on nopeus-ja luotettavuusongelmia

Habibin kokouspöytäkirjan mukaan käyttäjien suurimmat valitukset ChatGPT:stä olivat API-rajapinnan nopeus ja luotettavuus. Altman ymmärsi tämän ja selitti, että suurin syy on se, että grafiikkasuoritin ei todellakaan ole tarpeeksi. Pian kokouksen pöytäkirjan julkistamisen jälkeen OpenAI otti yhteyttä Habibiin ja ilmoitti, että tapahtumaa ei ole tarkoitus julkaista.

Vaikka Habib poisti twiitin myöhemmin, se kesti tarpeeksi kauan, jotta ihmiset saivat vilauksen tärkeimmistä yksityiskohdista. Raporttien mukaan Altman valitti, että GPU-pula johti alhaiseen laskentatehoon, eikä OpenAI voinut laajentaa ChatGPT:n chat-listaa. Tämä vaikuttaa tietomäärään, jonka ChatGPT voi käsitellä vastatessaan käyttäjien kysymyksiin. Se myös rajoittaa ChatGPT:n”muistia”ja sen voi olla vaikea käsitellä aiempia kysymystietueita. Lisäksi ChatGPT ei voi suorittaa tylsempiä tehtäviä alhaisen laskentatehon vuoksi. Tekoälytyökalun voi esimerkiksi olla vaikea kirjoittaa monimutkaisia ​​ohjelmakoodeja riittämättömien GPU:iden vuoksi.

IT Homen mukaan OpenAI on yksi monista brändeistä, joita vaivaa GPU-pula. Pilvipalveluiden tarjoajilla, kuten Googlella, Amazonilla ja Microsoftilla, on kaikilla vakava pula grafiikkasuorituksista. Tämä aiheutti myös suuren toimittajan Nvidian osakekurssin nousun, ja siitä tuli ensimmäinen puolijohdeyhtiö, jonka markkina-arvo on yli biljoona. Yhtiön osakekurssi on noussut lähes kaksi kertaa tänä vuonna.

Viikon Gizchina-uutiset

GPU-pulan historia

GPU-pula ei ole uusi ongelma teknologiateollisuudessa. Vuonna 2017 markkinoilla oli vastaava pula, koska näytönohjainten kysyntä kasvoi Ethereumin hintojen nousun vuoksi. Nykyinen pula on kuitenkin erilainen siinä mielessä, että useat tekijät ovat laajentuneet ja pahentaneet sitä. Pääsyyllinen on GPU-toimitusketjuihin liittyvä ongelma, jota on edistänyt alueen lisääntynyt kysyntä. Pandemia on myös häirinnyt toimitusketjuja ja kasvattanut koko puolijohdeteollisuutta. Tämä vaikeuttaa yritysten pääsyä tarvittaviin komponentteihin GPU:iden tuotantoon.

GPU-vajeen vaikutus ChatGPT:hen

ChatGPT:n suosion räjähdysmäinen kasvu on herättänyt pelkoja uudesta GPU-pulasta. on horisontissa. Eräs analyytikko väittää, että noin 10 000 Nvidian GPU:ta käytettiin ChatGPT:n kouluttamiseen. Lisäksi on raportoitu, että kun palvelu laajenee, myös GPU:iden tarve kasvaa.

GPU-pula on vaikeuttanut OpenAI:n mahdollisuuksia antaa käyttäjien siirtää enemmän dataa sen ohjelmistojen taustalla olevien suurten kielimallien, kuten ChatGPT:n, kautta. Tämä hidasti yrityksen suunniteltua uusien ominaisuuksien ja palveluiden käyttöönottoa. Se on myös tehnyt OpenAI:n olemassa olevista palveluista hitaampia ja vähemmän luotettavia. Tämä on suuri ongelma monille käyttäjille, ja se tekee heistä haluttomia rakentamaan yrityssovelluksia OpenAI:n tekniikan päälle.

On kuitenkin tärkeää huomata, että GPU-pulan tarkka tila ei ole todella selvä. Fierce Electronicsin maaliskuussa 2023 julkaiseman artikkelin mukaan GPU-tarjonnasta on”valtava”pula tekoälytarpeiden vuoksi. Toisaalta elokuussa Ars Technican raportti väittää, että GPU-pula on virallisesti ohi ja että olemme nyt GPU-ylijäämässä. The Verge raportoi myös heinäkuussa 2022, että GPU-pula on ohi. Näin ollen GPU-pulan tarkka tila on edelleen hieman epäselvä. Se voi riippua useista tekijöistä, kuten sijainnista, kysynnästä ja toimitusketjun häiriöistä.

Mahdollisia ratkaisuja GPU-pulaan

Yksi ​​mahdollinen ratkaisu GPU-pulaan on puolijohdeyritysten kasvattaminen niiden tuotantokapasiteettia. Tämä on kuitenkin helpommin sanottu kuin tehty, sillä pandemia on häirinnyt toimitusketjuja ja vaikeuttanut yritysten pääsyä tarvittaviin komponentteihin GPU:iden tuotantoon.

Toinen mahdollinen ratkaisu on yritysten löytää vaihtoehtoisia tapoja kouluttautua ja käyttää suuria kielimalleja, kuten ChatGPT. Esimerkiksi OpenAI on estänyt tehokkaan uuden kielimallinsa, GPT-4:n, ChatGPT:n ilmaisesta versiosta. käyttää edelleen heikompaa GPT-3.5-mallia GPT-4:n korkeiden käyttökustannusten vuoksi.

OpenAI:n toimitusjohtaja Sam Altman on epäsuorasti myöntänyt ongelman ja todennut, että yritys pyrkii tekemään tekoälymalleistaan ​​tehokkaampia ja vähemmän resurssiintensiivisiä.

Lopuksi

GPU-pula on valtava este ChatGPT:lle ja muille suurille kielimalleille. Pandemia ja GPU:iden lisääntynyt kysyntä ovat vaikeuttaneet merkkien pääsyä GPU:iden tuotantoon tarvittaviin osiin, mikä on hidastanut ChatGPT:n uusien ominaisuuksien ja palveluiden käyttöönottoa.

Tähän ongelmaan on kuitenkin potentiaalisia ratkaisuja, kuten tuotantokapasiteetin lisääminen ja vaihtoehtoisten tapojen löytäminen suurten kielimallien kouluttamiseen ja ajamiseen. Teknologiateollisuuden kehittyessä on mielenkiintoista nähdä, kuinka OpenAI:n kaltaiset yritykset selviytyvät GPU-pulan aiheuttamista haasteista ja jatkavat innovointia tekoälyn alalla.

Lähde/VIA:

Categories: IT Info