Firma Intel oficjalnie zaprezentował następcę swojego flagowego modelu nowej generacji Procesor graficzny Xe, Ponte Vecchio, znany jako most Rialto. Nowy układ graficzny został zaprojektowany z myślą o następnej generacji segmentu centrów danych AI i HPC, dążąc do procesorów AMD CDNA i NVIDIA CUDA.

Prezentacja procesora graficznego Intel Rialto Bridge: następca Ponte Vecchio z 25% większą liczbą rdzeni, Zwiększone flopy, ukierunkowane na procesory graficzne AMD i NVIDIA Data Center

Procesor graficzny Intel Rialto Bridge może być postrzegany jako ulepszona wersja Ponte Vecchio z większą liczbą rdzeni, większą liczbą flopów, większą przepustowością i większą liczbą GT/s. Intel nie ujawnił wielu szczegółów, ale twierdzi, że most Rialto będzie miał do 160 rdzeni Xe. Nie wiemy jeszcze, czy są to te same rdzenie, co obecne procesory graficzne Ponte Vecchio, czy też są oparte na zupełnie nowej architekturze, ale wygląda na to, że to drugie może być prawdą.

Intel Falcon Shores XPU, aby osiągnąć wysoki poziom Ekstremalna wydajność obliczeniowa dzięki wielokafelkowym konfiguracjom procesorów x86 i procesorów graficznych Xe, ukierunkowanych na ponad 5-krotną wydajność na wat

Dzisiaj ogłaszamy naszego następcę tego potężnego procesora graficznego dla centrum danych o nazwie kodowej Rialto Bridge. Rozwijając architekturę Ponte Vecchio i łącząc ulepszone kafelki z następną technologią węzłów procesowych, most Rialto zapewni znacznie większą gęstość, wydajność i efektywność, przy jednoczesnym zapewnieniu spójności oprogramowania.

Nazywa się most Rialto firmy Intel po moście o tej samej nazwie, który jest najstarszym z czterech mostów łączących Canale Grande w Wenecji we Włoszech. Tak było w przypadku Ponte Vecchio i wygląda na to, że następna generacja, która pojawi się po Rialto, również zostanie nazwana na cześć kultowego mostu. Według Intela, jego procesor graficzny Rialto Bridge będzie zasilał następną generację rozwiązań AI i HPC Data Center, jednocześnie dążąc do akceleratorów AMD CDNA i NVIDIA CUDA.

Pod względem specyfikacji, wiemy tylko, że procesor graficzny Rialto Bridge pomieści do 160 rdzeni Xe w zupełnie nowym formacie OAM v2. Ale oprócz ujawnienia specyfikacji, Intel daje nam również pierwsze spojrzenie na sam układ i jest kilka rzeczy, które możemy przeanalizować. Największa zmiana w GPU dotyczy układu matrycy GPU. Podczas gdy Ponte Vecchio ma 16 matryc Xe-HPC, każdy z 8 rdzeniami Xe, co daje łącznie 128 rdzeni lub 16 384 jednostek ALU, procesor graficzny Rialto Bridge jest wyposażony w 8 16 matryc Xe-HPC. Powinno to być 20 rdzeni Xe na matrycę, co daje łącznie 160 rdzeni Xe na 8 matrycach. To zaokrągla do 20 480 jednostek ALU, co stanowi 25-procentowy wzrost w porównaniu z poprzednikiem.

Pozostała struktura GPU Rialto Bridge jest prawie taka sama jak w przypadku procesora graficznego Ponte Vecchio z dwoma płytkami Xe Link, ośmioma płytkami HBM (HBM3) z czterema stosami HBM powiązanymi z każdym żetonem obliczeń (4 kostki Xe HPC). Wokół żetonów obliczeń znajdują się również pasywne usztywniacze kości, podczas gdy żetony Xe Link i HBM3 są połączone z żetonem obliczeń za pomocą żetonu EMIB. Układ scalony Foveros jest używany przez płytkę obliczeniową do komunikacji z pozostałymi matrycami Xe. Nie znamy jeszcze rzeczywistej odmiany każdego kafelka, ale powinien on opierać się na nowym projekcie Foveros Omni (3. generacji). Wygląda również na to, że brakuje kafelka pamięci podręcznej Rambo, ale jest bardzo możliwe, że biorąc pod uwagę wzrost rozmiaru każdego kafelka Obliczenia, pamięć podręczna znajduje się teraz na samym kafelku Oblicz, a nie jest oddzielona na osobnym kafelku.

Procesory Intel Sapphire Rapids HBM „Xeon Scalable” z 64 GB pamięci HBM2e oferują nawet 3-krotny wzrost wydajności w porównaniu z Ice Lake Xeons

Jeśli chodzi o wydajność, Intel nie ujawnił wyraźne liczby i stwierdził tylko, że powinniśmy spodziewać się większej liczby FLOP, GT/s i zwiększonej przepustowości. Zwiększona przepustowość powinna pochodzić z ulepszonych matryc pamięci HBM3. Procesory graficzne Ponte Vecchio są już wyposażone w pamięć VRAM o pojemności do 128 GB, więc powinno to być to, co widzimy również w procesorach graficznych Rialto Bridge, ale Intel może to zrobić jeszcze wyżej.

Poniższy jest pełny Intel Rialto Konfiguracja matrycy mostka, którą możemy w tej chwili przeanalizować:

8 Xe HPC (wewnętrzne/zewnętrzne) 2 Xe Base (wewnętrzne) 11 EMIB (wewnętrzne) 2 Xe Link (zewnętrzne) 8 HBM (zewnętrzne)

Intel hasn nie podano czasu wydania ani szczegółów dotyczących węzła procesowego dla procesora graficznego Rialto Bridge, ale prawdopodobnie usłyszymy o nim więcej w połowie 2023 r., kiedy będzie on próbkowany dla pierwszych klientów, a jego uruchomienie ma na celu późny 2023 lub 1 półrocze z 2024 r.

Akceleratory GPU następnej generacji do centrów danych

Nazwa GPUAMD Instinct MI250XNVIDIA Hopper GH100Intel Ponte VecchioIntel Rialto Bridge DesignMCM (Infinity Fabric)MonolitycznyMCM (EMIB + Foveros)MCM (EMIB + Foveros) Architektura GPUAldebaran (CDNA 2)Hopper GH100Xe-HPCXe-HPC Proces Node6nm4N7nm (Intel 4)5nm (Intel 3)? Rdzenie GPU14 08016 89616 384 jednostek ALU
(128 rdzeni Xe)20 480 jednostek ALU
(160 rdzeni Xe) Szybkość zegara GPU1700 MHz~1780 MHz Pamięć podręczna TBATBA L2/L32 x 8 MB50 MB2 x 204 MBTBA FP16 Compute383 TOPs2000 TFLOPSTBATBA FP32 Obliczenia95,7 TFLOP1000 TFLOP~45 TFLOP (A0 Silicon)TBA FP64 Obliczenia47,9 TFLOP60 TFLOPsTBATBA Pojemność pamięci128 GB HBM2E80 GB HBM3128 GB HBM2e128 GB HBM3? Zegar pamięci3,2 Gb/s3,2 Gb/sTBATBA Magistrala pamięci8192-bit5120-bit8192-bit8192-bit Przepustowość pamięci3,2 TB/s3,0 TB/s~3 TB/s~3 TB/s Współczynnik kształtuOAMOAMOAMOAM v2 ChłodzeniePasywneChłodzenie
Chłodzenie ciecząPasywne Chłodzenie
Chłodzenie ciecząChłodzenie pasywne
Chłodzenie ciecząChłodzenie pasywne
Chłodzenie cieczą TDP560W700WTBDTBD LaunchQ4 20212H 20222022?2024?

Categories: IT Info