EPYC 9654 to nowy flagowy procesor AMD ze sportowymi 96 rdzeniami/192 wątkami, a Zegar bazowy 2,4 GHz z zegarem boost 3,7 GHz i TDP 360 W. Konfigurowalny TDP na tej jedynej 96-rdzeniowej części wynosi od 320 do 400 watów.

>

W międzyczasie EPYC 9554 jest 64-rdzeniową częścią AMD o wyższym poziomie niż EPYC 9534. 9554 ma 64 rdzenie/128 wątków z zegarem bazowym 3,1 GHz i taktowaniem doładowania 3,75 GHz, a jednocześnie ma 360 W TDP, podobnie jak EPYC 9654. Podobnie jak EPYC 9654, cTDP można regulować w zakresie od 320 do 400 W. Obecny flagowy procesor Milan, EPYC 7763, dla przypomnienia to 64 rdzenie/128 wątków z taktowaniem bazowym 2,45 GHz i maksymalnym taktowaniem doładowania 3,5 GHz. Lub po stronie Milan-X jest EPYC 7773X z zegarem bazowym 2,2 GHz i maksymalnym taktowaniem 3,5 GHz, mający 768 MB pamięci podręcznej L3.

AMD EPYC 9374F 32-Część rdzenia o wysokiej częstotliwości, która pojawia się w oddzielnej recenzji, ma zegar bazowy 4,05 GHz i wzmocnienie 4,3 GHz, a jednocześnie ma TDP 320 W.

EPYC 9654 ma cena premiery wynosi około 11 805 USD, EPYC 9554 będzie sprzedawany w sprzedaży detalicznej za około 9087 USD, a EPYC 9374F za około 4 850 USD.

Porównanie wielkości AMD Milan SP3 z AMD Genoa SP5.

AMD uprzejmie udostępniło platformę referencyjną Titanite i procesory EPYC 9004 Genoa na potrzeby tej recenzji i testów porównawczych Linuksa. W dniu dzisiejszym przegląd testowanych procesorów serwerowych obejmuje:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Wszystkie te procesory zostały świeżo przetestowane/przetestowane na Ubuntu 22.10 z jądrem Linux 6.0 i GCC 12. Więcej szczegółów na temat stosu oprogramowania poniżej.

W przypadku nowych procesorów EPYC Genoa przetestowałem EPYC 9554 i 9654 zarówno w domyślnym trybie determinizmu „wydajności”, jak i w BIOS przełącza się na tryb determinizmu „mocy” dla tych, którzy są ciekawi ogólnego wpływu kontroli determinizmu na wydajność z BIOS-u. Przyrostek „-Moc” Wyniki Genua są wyświetlane podczas pracy w trybie determinizmu mocy w stosunku do domyślnego determinizmu wydajności. Wszystkie inne ustawienia systemu BIOS dla każdego z testowanych procesorów Intel/AMD miały odpowiednie wartości domyślne. Zarówno testy 1P, jak i 2P zostały przeprowadzone na wszystkich dostępnych testowanych procesorach.

Biorąc pod uwagę moje zwykłe „krwawienie” i skupienie się na przyszłości, wszystkie te testy zostały przeprowadzone z Ubuntu 22.10 z jego kompilatorem GCC 12.2. Dla świeżego wyglądu jądra, w użyciu był Linux 6.0. Ten sam stos oprogramowania był używany na wszystkich testowanych serwerach/procesorach. Każda z konfiguracji działała z pamięcią z maksymalną prędkością znamionową i konfiguracją kanału pamięci. Wszystkie procesory zostały przetestowane przy użyciu regulatora skalowania częstotliwości procesora „wydajności”.

Ubuntu 22.04 LTS jest jednak w dobrym stanie również dla EPYC Genoa i przeprowadziłem testy tych procesorów z serii EPYC 9004 na Ubuntu 22.04 z jej jądro Linux 5.15, ale dla mojego spojrzenia na wydajność Linuksa patrzącego w przyszłość i chcącego korzystać z najnowszego oprogramowania, ta runda testów porównawczych została wykonana z Ubuntu 22.10 + Linux 6.0 na wszystkich testowanych procesorach serwerowych.

Nic nie jest zaskoczeniem, obsługa procesora AMD EPYC 9004 „Genua” dla systemu Linux jest w dobrym stanie do wprowadzenia na rynek. Używanie dystrybucji z najnowszą wersją jądra Linuksa (lub korporacyjnej dystrybucji Linuksa z jądrami z przeportowanymi/załatanymi jądrami) powinno być w dobrym stanie dla tych procesorów serwerowych Zen 4. Istnieje kilka funkcji, które pojawiły się dopiero niedawno, jak zaktualizowana obsługa rekordów ostatniej gałęzi, ale wszystkie kluczowe funkcje są już gotowe – w tym monitorowanie temperatury i zużycia energii. Po stronie kompilatora obsługa Zen 4 (znver4) jest spóźniona. AMD dopiero niedawno opublikowało swoją początkową łatkę umożliwiającą obsługę Znver4, jednocześnie przenosząc tabele kosztów z Znver3. To początkowe wsparcie zostanie znalezione w GCC 13, które ma się ukazać w pierwszych miesiącach przyszłego roku, a wsparcie LLVM/Clang 16.0 jest w toku. Oczekuje się, że AMD wkrótce wyda nową wersję AOCC dla swojego kompilatora AMD Optimizing C/C++ z optymalizacjami Zen 4.

Podczas testów porównawczych przeprowadzono szeroki wybór testów porównawczych serwerów/HPC, jednocześnie monitorując moc procesora zużycie przez wyeksponowane interfejsy RAPL i dostarczanie wskaźników wydajności w przeliczeniu na wat i więcej.

Zaraz po uruchomieniu niektórych testów HPC, procesory AMD EPYC Genoa pokazują swoją sprawność w zakresie wydajności. Procesor AMD EPYC 9654 2P miał o 40% krótszy czas działania dla kodu GPAW DFT w porównaniu do EPYC 7773X Milan-X i zbliżał się do punktu, w którym był prawie dwa razy szybszy niż procesory EPYC 7763. Po przejściu na tryb determinizmu mocy procesory EPYC Genoa wycisnęły więcej wydajności. Po prostu nie chodzi o porównanie 96 rdzeni w porównaniu z 64 rdzeniami, co doprowadziło do dużego wzrostu w Genui, ponieważ wydajność 64-rdzeniowego procesora EPYC 9554 1P2P również była znakomita – EPYC 9554 odpowiadał wydajności EPYC 7763 2P dla GPAW!

Ale Oczywiście, te nowe procesory EPYC 9554/9654 zużywają więcej energii niż ich poprzednicy, jak można się było spodziewać.

W przeliczeniu na dolara, nowe procesory EPYC 9554/9654 działają całkiem nieźle. w stosunku do części poprzedniej generacji. Oczywiście jest to tylko wycena procesora, ale należy również wziąć pod uwagę wycenę pamięci DDR5 i wycenę platformy, ale nie było możliwe dokonanie dokładnych ocen przed premierą, aby zobaczyć, jak porównają się ceny płyt głównych Genoa itp. to Milan(X).

Wydajność AMD EPYC 9654 i EPYC 9554 była równie znakomita w porównaniu z testem porównawczym dynamiki molekularnej GROMACS. Wydajność EPYC 9654 2P była o 1,66x większa od szybkości EPYC 7773X 2P, a konfiguracja EPYC 9654 1P prawie dorównywała wydajności EPYC 7773X 2P… Znaczny wzrost dzięki dodatkowym rdzeniom, pamięci systemowej DDR5, 12 kanałom pamięci, AVX-512 i inne ulepszenia architektury Zen 4. A jeśli działa w trybie determinizmu mocy, jeszcze wyższa wydajność.

Podczas gdy zużycie energii EPYC Genoa było wyższe niż w przypadku EPYC Milan(X) i Xeon Ice Lake, na podstawie wydajności na wat dla GROMACS wydajność znajduje się w Genui. Flagowe procesory Intela Xeon Platinum 8380 były po prostu niekonkurencyjne w stosunku do Genui i miały wystarczająco dużo czasu na starcie z Milan(X) w większości testów porównawczych, ale przynajmniej Xeon Sapphire Rapids, miejmy nadzieję, pojawi się w przyszłym kwartale.

-wskaźniki w dolarach oparte na cenie procesora sprawiają, że Genoa jest w dobrej kondycji.

Przetestowane procesory EPYC Genoa spisały się niesamowicie z NAMD i dostarczyły wspaniałe wyniki pokoleniowo z Mediolanu/Mediolan-X i zwiększyły przewagę nad obecną generacją Procesory Xeon Ice Lake.

AMD EPYC Genoa spisał się znakomicie w benchmarku Graph500.

Wyniki EPYC 9654/9554 były również oszałamiające w teście HPCG. Mówiąc najprościej, seria AMD EPYC 9004 w wielu różnych testach konsekwentnie zapewniała bezprecedensowy wzrost wydajności.

Procesory EPYC 9554 i EPYC 9654 wykazały fenomenalną wydajność przy prognozowaniu pogody przy użyciu WRF. Przejście nie tylko z EPYC 7773X/7763 do EPYC 9654 było oszałamiające, ale nawet 64-rdzeniowy EPYC 9554 miał ogromną przewagę dzięki AVX-512 i innym ulepszeniom w stosunku do wcześniejszych procesorów serwerowych Zen 3.

Włącz w oparciu o wydajność na dolara z WRF, procesory EPYC Genua nadal świeciły.

W przypadku RELION poprawa generacyjna była mniejsza, ale nadal znacząca od Mediolanu(X) do Genui.

AMG był jednym z niewielu testów porównawczych, w którym procesory Xeon Platinum 8362/8380 Ice Lake mogły wyprzedzić flagowe procesory EPYC Milan, ale nie było to już w przypadku Genui.

Mimo że EPYC ma wyższe zużycie energii, Procesory Genoa zapewniały doskonałą wydajność energetyczną.

W szerokim zakresie testów HPC wydajność procesora EPYC Genoa była po prostu fenomenalna. Ostatnie kilka tygodni korzystania z EPYC Genoa było jednymi z najbardziej fascynujących wyników testów wydajności, jakie widziałem w ciągu ostatnich 18 lat, z niesamowitym wzrostem pokoleniowym, przy jednoczesnym zapewnieniu wiodącej wydajności energetycznej i wartości.

Wszędzie. szeroki asortyment testów HPC, konfiguracje EPYC 9654 i 9554 oferowały znakomitą wydajność w domyślnym trybie determinizmu wydajności.

OpenVINO dla projektu oprogramowania AI open source firmy Intel osiągnęło świetne wyniki na AMD EPYC 9004 „Genua”procesory z AVX-512. Procesory Xeon Platinum 8362/8380 zapewniły lepszą wydajność w porównaniu z procesorami Milan/Milan-X dzięki AVX-512, ale wydajna implementacja AVX-512 w Genoa doprowadziła teraz do znacznie wyższej wydajności dzięki OpenVINO.

Wzrost dzięki OpenVINO dla Genui jest tak dramatyczny, że wydajność w przeliczeniu na dolara znacznie przewyższa wydajność istniejących procesorów Intel/AMD.

OpenVINO było ostoją dla Intel Xeon Scalable „Ice Lake” w porównaniu z Mediolanem/Milanem-X ale procesor EPYC 9554 „Genoa” może nawet konkurować z dwoma procesorami Xeon Platinum 8380. Wydajność Genui jest szalona.

W wielu różnych testowanych modelach OpenVINO 2022 działał doskonale z procesorami EPYC Genoa dzięki obsłudze AVX-512. Chociaż początkowo martwiłem się implementacją AVX-512 w Zen 4 przy użyciu 256-bitowej ścieżki danych, okazało się, że działa bardzo dobrze i bez wpływu AVX-512 na moc/termię na wcześniejszych procesorach Intela.

Procesory EPYC Genoa działały również bardzo dobrze z biblioteką głębokiej sieci neuronowej oneDNN firmy Intel, która jest w stanie w szerokim zakresie wykorzystać AVX-512.

Nawet w przypadku „prostej” pracy, takiej jak kompilacja kodu w wielu zadaniach, aby nasycić Procesory, wydajność serii AMD EPYC 9004 nadal zapewniała znaczne ulepszenia generacyjne w porównaniu z Mediolanem.

Przewaga liczby rdzeni z AMD EPYC również pomaga i jest obszarem, w którym EPYC Genoa nadal będzie przewodzić nad nadchodzącymi procesorami Intel Sapphire Rapids.

Nowe, wysokiej klasy procesory Genoa mogą skompilować domyślne jądro Linux x86_64 w mniej niż 20 sekund!

Albo budowanie pełnego jądra ze wszystkimi dostępnymi modułami jądra można wykonać w ramach dwie minuty.

W przeliczeniu na dolara wynik EPYC Genoa były porównywalne z aktualnymi cenami Mediolanu w przypadku zainteresowania farmą kompilacji kodu/serwerem CI.

Dla farm renderujących opartych na procesorach, AMD EPYC Genoa z maksymalnie 96 rdzeniami i ulepszenia projektowe w stosunku do Zen 3 opłaciło się znaczną poprawą czasu renderowania. W dobrze znanej scenie BMW flagowy procesor EPYC 9654 2P mógł renderować to w zaledwie 8 sekund!

AMD EPYC Genoa działała bardzo dobrze z Blenderem 3.3 z dużymi ulepszeniami generacyjnymi i znacznie lepszą wydajnością niż to, co może można osiągnąć dzięki Xeon Scalable Ice Lake i jego znacznie mniejszej liczbie rdzeni.

Tryb determinizmu mocy może pomóc w jeszcze dłuższych czasach renderowania Blendera, jeśli nie masz nic przeciwko zwiększonemu wpływowi mocy/temperatury.

Pod względem wydajności w przeliczeniu na dolara, nowe procesory Genoa są cenowo bardzo porównywalne z cenami Mediolanu, przynajmniej pod względem procesora.

Jądra ray tracingu Embree firmy Intel mogą znacznie skorzystać na Genua z AVX-512. Procesor EPYC 9654 2P w trybie determinizmu mocy był dwukrotnie szybszy od procesora AMD EPYC 7773X 2P.

Chociaż te testowane procesory Genoa mają wyższy pobór mocy niż Milan, w stosunku do wydajności na wat. znacznie lepiej niż inne procesory Intel/AMD.

Genua działała dobrze w innych zoptymalizowanych pod kątem AVX-512 składnikach oprogramowania Intel, które są częścią ich kolekcji oneAPI.

Promień OSPRay-silnik śledzący odniósł pewne zwycięstwa z procesorami Xeon Platinum 8380/8662 nad Milanem/Milanem-X, ale nie dotyczy to już Genui. Ponieważ OSPRay jest dobrze zoptymalizowany przez firmę Intel pod kątem wykorzystania AVX-512 na ich procesorach Xeon, działa równie dobrze z nowymi procesorami serwerowymi AMD AVX-512.

W przypadku zadań renderowania opartych na procesorach wyniki Genoa były szczególnie wspaniałe. w przypadkach takich jak pojedynczy EPYC 9654, który jest w stanie przewyższyć konfiguracje 2P EPYC 7773X lub 2P 7763.

W jednowątkowym benchmarku Node.js Genoa była teraz w stanie wyprzedzić Ice Lake dzięki Ulepszenia architektury Zen 4.

Test parsowania simdjson JSON zwykle nie jest interesujący dla dużych wydajności serwerów, ale teraz simdjson ma zoptymalizowaną ścieżkę AVX-512. Procesory z serii EPYC 9004 znacznie wyprzedziły Ice Lake dzięki obsłudze Zen 4 AVX-512.

Zużycie energii było również porównywalne z Ice Lake, ponieważ procesory nie były w pełni nasycone w teście parsowania JSON.

EPYC 9554 zapewniał najlepszą wydajność w przeliczeniu na wat dla tego testu parsowania obsługującego AVX-512 dla gigabajtów danych JSON.

Jednowątkowe testy wydajności Pythona również pokazał niezłe postępy w Zen 4.

I kilka bardzo fajnych ulepszeń dla Numpy.

Wydajność jednowątkowego PHP w Genui była teraz w stanie porównywalnym tylko do Ice Lake , ale w przypadku w pełni obciążonego serwera WWW oczywiście można znaleźć większą pojemność dzięki Genui i jej większej liczbie rdzeni/wątków.

W przypadku bardziej typowych obciążeń, takich jak kompresja plików/danych, Zen 4 z Genuą zapewnia kilka fajnych, przyrostowych ulepszeń w stosunku do Zen 3.

Genua odniosła kilka gwiezdnych zwycięstw dzięki BRL-CAD.

Wystąpił znaczny wzrost pokoleniowy, aby cieszyć się y z Genoa dla oprogramowania do cyfrowego przetwarzania sygnału Liquid-DSP o otwartym kodzie źródłowym.

Krótko mówiąc, z około 200 różnych testów, które przeprowadziłem, procesory AMD EPYC 9654 i EPYC 9554 odniosły ogromny sukces. Zapewniły one wspaniały ogólny wzrost generacyjny, ale szczególnie w przypadku wielu obciążeń HPC/serwerów, które mogą wykorzystać AVX-512, co z kolei poszerzyło przewagę AMD nad obecnymi skalowalnymi procesorami Xeon „Ice Lake”.

OpenFOAM daje wyniki dzięki EPYC Genua była fantastyczna w przypadku obliczeniowej dynamiki płynów (CFD) o otwartym kodzie źródłowym.

OpenRadioss firmy Altair również wygląda bardzo dobrze w Genui. (Nie wszystkie procesory zostały tutaj przetestowane z powodu dodania tego nowego testu porównawczego późno w cyklu przeglądu testów. Ale biorąc pod uwagę zainteresowanie nowym projektem open source firmy Altrair, oto te punkty odniesienia dla testowanych procesorów.)

Those wishing to see all of the benchmarks I ran in full can do so via