Wygląda na to, że akcelerator GPU nowej generacji Instinct MI300 pojawił się po raz pierwszy w najnowszym Poprawka dla systemu Linux.

GPU AMD Instinct MI300 „GFX940”, akcelerator MCM centrum danych nowej generacji, umożliwia pierwsze pojawienie się w łatce dla systemu Linux

Najnowsza poprawka dla systemu Linux zawiera nowy cel dla niewydany AMD’GFX940’GP, który ma podobny ISA jak GPU Aldebaran’GFX90a’. Spekuluje się, że ten układ może zasilać akcelerator GPU następnej generacji AMD Instinct MI300 i obsługuje wszystkie funkcje skoncentrowane na danych, takie jak MFMA (Matrix-Fused-Multiply-Add), pełnowymiarowe FP64 i upakowane operacje FP32. Inne funkcje obejmują również XNACK, który jest specyficzny dla integracji przestrzeni pamięci CPU + GPU, jak Coelacanth-Dream mówi o tym.

AMD EPYC zyskuje wzrost wydajności w Linuksie 5.18, ulepszenia harmonogramu/NUMA Benchmarked

Źródło podaje, że chociaż GPU ISA jest podobny, GFX940 ma kilka różnic w porównaniu z procesorami graficznymi Aldebaran „CDNA 2”, które są wymienione poniżej:

GPU AMD GFX90a i GFX940 dla akceleratorów Instinct nowej generacji porównanie funkcji. (Źródła zdjęcia: Coelacanth-Dream)

Poprzednie plotki wskazywały, że AMD Instinct MI300 będzie wyposażony w konstrukcję 4-GCD opartą na zupełnie nowej architekturze CDNA 3. Nadchodzący Instinct MI200 miał zawierać 128 jednostek obliczeniowych na kostkę, ale od zeszłotygodniowej plotki zmieniło się to na 110 jednostek obliczeniowych. Łącznie 220 jednostek obliczeniowych dałoby 14 080 rdzeni, a jeśli weźmiemy dokładną liczbę i pomnożymy ją przez 4 (liczba GCD w Instinct MI300), otrzymamy 440 jednostek obliczeniowych lub szalone 28 160 rdzeni.

MI300 😍https://t.co/B3qlnQBbVG

— Kepler (@Kepler_L2) 1 marca 2022

MI300 będzie dostępny 4 GCD 🧐

— Kepler (@Kepler_L2) 7 września 2021

Niedawne ROCm firmy AMD Aktualizacja Narzędzi dla programistów zauważona przez Komachi potwierdziła maksymalnie 4 MCM GPU, ale to po prostu jednostki SKU „Aldebaran”. Oczekuje się, że będą co najmniej cztery akceleratory Instinct z zasilaniem CDNA 2 z odpowiednimi (unikalnymi identyfikatorami) wymienionymi poniżej. Należy pamiętać, że liczba ta nie reprezentuje liczby matryc na każdym urządzeniu, ale raczej samo urządzenie:

Procesory AMD Ryzen 5000 do komputerów stacjonarnych Uzyskaj główne obniżki cen specyficzne dla sprzedawców detalicznych: Ryzen 9 5950X Teraz za 599 USD, 5900X w 449 USD, 5800X za 299 USD, 5600X za 229 USD

0x7408 0x740C 0x740F 0x7410

Teraz byłoby prawdą, gdyby AMD nie wprowadzało żadnych zmian podczas przechodzenia z CDNA 2 na CDNA 3, ale tak nie jest. Oczekuje się, że CDNA 3 przedstawi poprawioną nową architekturę, która nie będzie kolejną pochodną Vegi, taką jak Arcturus lub Aldebaran, co czyni tę plotkę bardziej wiarygodną.

Architektura GPU może również wykorzystywać układ, który może wyglądać podobny do nowego układu WGP/SE na nowych chipach RDNA 3 lub całkowicie nowy projekt dostosowany do segmentu HPC. Ale jedno jest pewne, te procesory graficzne z czterema procesorami MCM zdecydowanie są czymś, czego nie możemy się doczekać, aby zobaczyć w akcji!

AMD Radeon Instinct Accelerators 2020

Nazwa akceleratoraAMD Instinct MI300AMD Instinct MI250XAMD Instinct MI250AMD Instinct MI210AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6 Architektura GPUTBA (CDNA 3)Aldebaran (CDNADNACD2)AldebarV 20Vega 10Fiji XTPolaris 10 GPU Proces WęzełZaawansowany proces Węzeł6nm6nm6nm7nm FinFET7nm FinFET7nm FinFET14nm FinFET28nm14nm FinFET Matryce GPU4 (MCM)?2 (MCM)2 (MCM)1 (MCM)1 (Monolityczny)1 (Monolityczny)1 Monolityczne)1 (monolityczne) rdzenie GPU28160?14.08013,3126656768040963840409640962304 Szybkość zegara GPUTBA1700 MHz1700 MHz~1700 MHz?~1500 MHz1800 MHz1725 MHz1500 MHz1000 MHz1237 MHz FP16 ComputeTBA383 TOPs362 TOPs~176 TOPs185 TFLOPS29,5 TFLOP29,5 TFLOP.2 TFL OP5,7 TFLOPS FP32 ComputeTBA95.7 TFLOPS90,5 TFLOPS~44 TFLOPS23.1 TFLOPS14.7 TFLOP13.3 TFLOP12.3 TFLOPS8.2 TFLOPS5.7 TFLOP FP64 ComputeTBA47.9 TFLOP45.3 TFLOP~22 TFLOP11.5 TFLOPS6.6 TFLOPs768 GFLOPs512 GFLOPs384 GFLOPs VRAMTBA128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5 Zegar pamięciTBA3,2 Gbps3,2 Gbps?-bit4096-bit bus4096-bit bus4096-bit bus2048-bit bus4096-bit bus256-bit bus Przepustowość pamięciTBA3.2 TB/s3.2 TB/s1.6 TB/s1.23 TB/s1 TB/s1 TB/s484 GB/Współczynnik kształtu s512 GB/s224 GB/sTBAOAMOAMKarta z dwoma gniazdamiPodwójne gniazdo, o pełnej długości Podwójne gniazdo, o pełnej długości Podwójne gniazdo, o pełnej długości Podwójne gniazdo, o pełnej długości Podwójne gniazdo, o połowie długości Jedno gniazdo, chłodzenie o pełnej długościTBAPChłodzenie pasywneChłodzenie pasywneW300Chłodzenie pasywneChłodzenie pasywneW175Chłodzenie pasywne

Categories: IT Info