Niedawne pogłoski dotyczące nowej generacji serii NVIDIA GeForce RTX 4090 sugerują, że karta graficzna zasilana AD102 może być pierwszy produkt do gier, który przekroczył barierę 100 TFLOP.

Karty graficzne NVIDIA GeForce RTX 4090 mogą stać się pierwszym gamingowym procesorem graficznym „AD102”, który przekroczy barierę 100 TFLOPs

Obecnie NVIDIA GeForce RTX 3090 Ti oferuje najwyższą wydajność obliczeniową spośród wszystkich kart graficznych do gier, osiągając od 40 do 45 TFLOP w obliczeniach GPU FP32 (pojedyncza precyzja). Ale wraz z pojawieniem się procesorów graficznych nowej generacji jeszcze w tym roku, sytuacja nabierze dużego tempa.

Karta graficzna Intel Arc Alchemist A770 zauważona w testach Geekbench i PugetBench

Szczerze mówiąc, nie mam zbyt wielu informacji o AMD. Może konkurencja Lisy i Jensena doprowadzi nas do wojny o 100 TFLOPS w ciągu kilku miesięcy.

— kopite7kimi (@kopite7kimi) 29 kwietnia 2022

Mogę tylko powiedzieć, że oba produkty znacznie się poprawiły w porównaniu do swoich poprzedników, ale jeśli chcesz zapytaj mnie bezpośrednio, który z nich jest lepszy, przepraszam, że nie mogę odpowiedzieć, ponieważ nikt nie zna konkretnej poprawy w procentach.

— Greymon55 (@greymon55) 30 kwietnia 2022

Zgodnie z pogłoskami z Kopite7kimi i Greymon55, karty graficzne nowej generacji, nie tylko firmy NVIDIA, ale także AMD, mają osiągnąć poziom 100 TFLOP. Oznaczałoby to ogromny kamień milowy na rynku grafiki konsumenckiej, który z pewnością odnotował znaczną wydajność, a także skok mocy w przypadku obecnej generacji kart. Od razu przeszliśmy od 275 W jako limitu do 350-400 W, które stało się normą, a modele takie jak RTX 3090 Ti już popijają ponad 500 W mocy. Następna generacja będzie jeszcze bardziej żądna energii, ale jeśli liczby obliczeniowe są czymś do przebycia, to już znamy jeden powód, dla którego będą pobierać tak dużo energii.

Zgodnie z raportem, procesory graficzne NVIDIA Ada Lovelace, zwłaszcza układ AD102, doznały poważnego przełomu w węźle procesowym 4N TSMC. W porównaniu z poprzednimi plotkami o częstotliwości taktowania 2,2-2,4 GHz, obecne szacunki mówią, że AMD i NVIDIA będą miały podobne do siebie prędkości doładowania, czyli około 2,8-3,0 GHz. Konkretnie w przypadku NVIDII, firma zamierza połączyć 18 432 rdzeni z 96 MB pamięci podręcznej L2 i 384-bitowym interfejsem magistrali. Zostaną one ułożone w układzie 12 matryc GPC z 6 TPC i 2 SM na TPC, co daje łącznie 144 SM.

Plotki o karcie graficznej NVIDIA GeForce RTX 40: GPU AD102 Dla RTX 4090 24 GB, GPU AD103 Dla RTX 4080 16 GB, GPU AD104 Dla RTX 4070 12 GB, klasa Titan Do 48 GB i 900 W

W oparciu o teoretyczną częstotliwość zegara 2,8 GHz, uzyskujesz do 103 TFLOP wydajności obliczeniowej i plotki sugerują jeszcze wyższe zegary doładowania. Teraz brzmią one zdecydowanie jak zegary szczytowe, podobne do szczytowych częstotliwości AMD, które są wyższe niż przeciętny zegar „Gry”. Wydajność obliczeniowa ponad 100 TFLOP oznacza ponad dwukrotnie większą moc w porównaniu z flagowym 3090 Ti. Należy jednak pamiętać, że wydajność obliczeniowa niekoniecznie wskazuje na ogólną wydajność w grach, ale mimo to będzie to ogromny postęp dla komputerów do gier i 8,5-krotny wzrost w porównaniu z obecną najszybszą konsolą Xbox Series X.

Tak więc pod koniec dnia z pewnością zobaczymy, że sprzęt PC, zwłaszcza karty graficzne, stanie się potężniejszy, ale wspaniale będzie zobaczyć, jak cała ta moc zostanie dobrze wykorzystana do uruchamiania gier nowej generacji, zwłaszcza Tytuły 8K z ray tracingiem i przyszłymi efektami graficznymi.

Nadchodzące flagowe specyfikacje procesorów graficznych AMD, Intel, NVIDIA (wstępne)

Nazwa GPUAD102Navi 31Xe2-HPG Nazwa kodowaAda LovelaceRDNA 3Battlemage Flagship SKUGeForce RTX 4090 SeriesRadeon Seria RX 7900 Proces GPU serii Arc B900TSMC 4NTSMC 5nm+ TSMC 6nmTSCM 5nm? Pakiet GPUMonolithicMCD (kostka Multi-Chiplet)MCM (moduł Multi-Chiplet) Matryce GPUMono x 12 x GCD + 4 x MCD + 1 x IODQuad-Tile (tGPU) GPU Mega Clusters12 GPC (klastry przetwarzania grafiki)6 silników cieniowania10 plasterków renderowania GPU Super Klastry72 TPC (klastry przetwarzania tekstur)30 WGP (na MCD)
60 WGP (łącznie)40 Xe-core (na płytkę)
160 Xe-core (łącznie) Klastry GPU144 Multiprocesory strumieniowe (SM)120 jednostek obliczeniowych (CU)
240 jednostek obliczeniowych (łącznie)1280 Xe VE (na płytkę)
5120 Xe VE (łącznie) Rdzenie (na układ)18432 CUDA Cores7680 SPs (na GCD)
15360 SPs (na Łącznie)20480 jednostek ALU (łącznie) Zegar szczytowy~2,85 GHz~3,0 GHzTBD FP32 Obliczenia~105 TFLOP~92 TFLOPsTBD Typ pamięci GDDR6XGDDR6GDDR6? Pojemność pamięci24 GB32 GBTBD Magistrala pamięci384-bit256-bitTBD Szybkość pamięci ~21 Gb/s~18 Gb/s Podsystemy pamięci podręcznej TBD96 MB Pamięć podręczna L2 512 MB (pamięć podręczna nieskończoności)TBD TBP~600W~500WTBD UruchomienieQ4 2022Q4 20222023

Categories: IT Info