Viimeaikaiset huhut seuraavan sukupolven NVIDIA GeForce RTX 4090-näytönohjainsarjasta saattavat viitata siihen, että tehoinen AD102-näytönohjain on ensimmäinen pelituote, joka ylittää 100 TFLOP:n rajan.

NVIDIA GeForce RTX 4090-luokan grafiikkakortit saattavat olla ensimmäinen AD102-GPU, joka ylittää 100 TFLOP:n rajan

Tällä hetkellä NVIDIA GeForce RTX 3090 Ti tarjoaa parhaan laskentasuorituskyvyn kaikkien pelien näytönohjainkorttien joukossa saavuttaen 40–45 TFLOP:n FP32 (Single-Precision) GPU-laskentaa. Mutta kun seuraavan sukupolven grafiikkasuorittimet saapuvat myöhemmin tänä vuonna, asiat saavat suuren sysäyksen.

Intel Arc Alchemist A770-grafiikkakortti havaittiin Geekbenchin ja PugetBenchin vertailuissa

Rehellisesti sanottuna minulla ei ole paljoakaan tietoa AMD:stä. Ehkä Lisan ja Jensenin kilpailu antaa meille 100TFLOPS:n pelisodan muutaman kuukauden sisällä.

— kopite7kimi (@kopite7kimi) 29. huhtikuuta 2022

Voin vain sanoa, että nämä kaksi tuotetta ovat parantuneet paljon edeltäjiinsä verrattuna, mutta jos haluat kysy suoraan kumpi on parempi, en valitettavasti voi vastata, koska kukaan ei tiedä konkreettista parannusta prosentteina.

— Greymon55 (@greymon55) 30. huhtikuuta 2022

Kopite7kimi ja Greymon55, seuraavan sukupolven näytönohjaimet, ei vain NVIDIAlta vaan myös AMD:ltä, odotetaan saavuttavan 100 TFLOP:n rajan. Tämä olisi valtava virstanpylväs kuluttajagrafiikkamarkkinoilla, jotka ovat ehdottomasti nähneet merkittävän suorituskyvyn ja myös tehohypyn nykyisen sukupolven korttien kanssa. Menimme suoraan 275 watin rajasta 350–400 wattiin, josta tuli normi, ja RTX 3090 Ti:n kaltaiset siemailevat jo yli 500 wattia tehoa. Seuraava sukupolvi tulee olemaan vieläkin valtaa kaipaavampi, mutta jos laskentaluvut ovat mitä tahansa, tiedämme jo yhden syyn, miksi he aikovat siemailla niin paljon tehoa.

Raportin mukaan NVIDIAn Ada Lovelace-grafiikkasuorittimet, erityisesti AD102-siru, ovat nähneet merkittävän läpimurron TSMC:n 4N-prosessisolmussa. Verrattuna aikaisempiin 2,2-2,4 GHz:n kellotaajuushuhuihin, tämänhetkisten arvioiden mukaan AMD:n ja NVIDIA:n boost-nopeudet ovat samankaltaisia, ja se on noin 2,8-3,0 GHz. Erityisesti NVIDIAa varten yhtiö aikoo sulauttaa yhteensä 18 432 ydintä yhdistettynä 96 Mt:n L2-välimuistiin ja 384-bittiseen väyläliitäntään. Nämä pinotaan 12 GPC:n muottiin, jossa on 6 TPC:tä ja 2 SM:ää per TPC, yhteensä 144 SM:ää.

NVIDIA GeForce RTX 40-näytönohjain Huhut: AD102 GPU RTX 4090:lle 24 Gt, AD103 GPU RTX 4080 16 Gt, AD104 GPU RTX 4070 12 Gt, Titan-luokka Jopa 48 Gt & 900 W

Teoreettisen 2,8 GHz:n kellotaajuuden perusteella saat jopa 103 TFLOPs laskentatehoa ja huhut viittaavat vielä korkeampiin tehostuskelloihin. Nyt nämä kuulostavat ehdottomasti huippukelloilta, samanlaisilta kuin AMD:n huipputaajuudet, jotka ovat korkeampia kuin keskimääräinen pelikello. Yli 100 TFLOPin laskentateho tarkoittaa yli kaksinkertaista hevosvoimaa verrattuna 3090 Ti-lippulaivaan. Mutta on syytä muistaa, että laskentateho ei välttämättä kerro pelien yleistä suorituskykyä, mutta siitä huolimatta se on valtava päivitys pelitietokoneille ja 8,5-kertainen nykyiseen nopeimpaan Xbox Series X-konsoliin verrattuna.

Joten loppujen lopuksi näemme taatusti PC-laitteiston, erityisesti näytönohjainten, tehostuvan, mutta on hienoa nähdä, että kaikki teho hyödynnetään seuraavan sukupolven pelien pyörittämiseen. 8K-nimikkeet säteenseurannalla ja tulevilla graafisilla tehosteilla.

Tulevat lippulaiva AMD, Intel, NVIDIA GPU:n tekniset tiedot (alustava)

GPU NameAD102Navi 31Xe2-HPG CodenameAda LovelaceRDNA 3Battlemage Flagship RKUGdeon9Flagship0SRaGdeon9 RX 7900 SeriesArc B900 Series GPU ProcessTSMC 4NTSMC 5nm+ TSMC 6nmTSCM 5nm? GPU Package MonolithicMCD (Multi-Chiplet Die)MCM (Multi-Chiplet Module) GPU DiesMono x 12 x GCD + 4 x MCD + 1 x IODQuad-Tile (tGPU) GPU Mega Clusterit 12 GPC:tä (Graphics Processing Clusters) 1 GPU (Graphics Processing Clusters) Klusterit72 TPC (tekstuurinkäsittelyklusterit) 30 WGP:tä (MCD:tä kohden)
60 WGP:tä (yhteensä) 40 Xe-ydintä (ruutua kohti)
160 Xe-ydintä (yhteensä) GPU-klusterit144 Stream-moniprosessoria (SM) 120 laskentayksikköä (CU)
240 laskentayksikköä (yhteensä)1280 Xe VE (yhteensä)
5120 Xe VE (yhteensä) ydintä (per Die)18432 CUDA ydintä 7680 SP (per GCD)
15360 SP (In Yhteensä) 20 480 ALU:ta (yhteensä) Huippukello ~ 2,85 GHz ~ 3,0 GHz TBD FP32 Laske ~ 105 TFLOPs ~ 92 TFLOPsTBD MuistityyppiGDDR6XGDDR6GDDR6?

Categories: IT Info