De EPYC 9654 is AMD’s nieuwe vlaggenschipprocessor met sportieve 96 cores/192 threads, een 2,4 GHz basisklok met 3,7 GHz boostklok en heeft een TDP van 360 Watt. Het configureerbare TDP op dit enige 96 core-onderdeel is van 320 tot 400 Watt.

De EPYC 9554 is ondertussen AMD’s hogere 64-core onderdeel ten opzichte van de EPYC 9534. De EPYC 9554 sport 64 cores/128 threads met een 3,1GHz basisklok en 3,75GHz boostklok terwijl hij een TDP van 360 Watt heeft zoals de EPYC 9654. Net als de EPYC 9654 kan de cTDP worden aangepast van 320 tot 400 Watt. De huidige vlaggenschip-processor van Milaan, de EPYC 7763, ter herinnering: 64 cores/128 threads met een basisklok van 2,45 GHz en een maximale boostklok van 3,5 GHz. Of aan de Milan-X kant is de EPYC 7773X met een 2,2GHz basisklok en 3,5GHz maximale boostklok terwijl hij de 768MB L3-cache heeft.

De AMD EPYC 9374F 32-core hoogfrequent deel dat in de afzonderlijke review naar voren komt, heeft een basisklok van 4,05GHz en een boost van 4,3GHz terwijl hij een TDP van 320 Watt heeft.

De EPYC 9654 heeft een lanceringsprijs rond de $ 11.805, de EPYC 9554 zal worden verkocht voor ongeveer $ 9.087 USD en de EPYC 9374F voor ongeveer $ 4.850.

Een groottevergelijking van AMD Milan SP3 bovenop AMD Genoa SP5.

AMD was zo vriendelijk om het Titanite-referentieplatform en de EPYC 9004 Genoa-processors te leveren voor deze review en Linux-benchmarking. Voor de lanceringsbeoordeling van vandaag omvatten de geteste serverprocessors:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Al deze processors zijn vers getest/opnieuw getest met Ubuntu 22.10 met de Linux 6.0-kernel en GCC 12. Meer details over de softwarestack hieronder.

Voor de nieuwe EPYC Genoa-processors heb ik de EPYC 9554 en 9654 zowel in de standaard”prestatie”-determinismemodus getest als in het BIOS schakelt over naar de”power”determinismemodus voor diegenen die nieuwsgierig zijn naar de algehele prestatie-impact van de determinismecontrole vanuit het BIOS. Het achtervoegsel”-Power”Genua-resultaten zijn wanneer ze in de vermogensdeterminismemodus worden uitgevoerd boven het standaard prestatiedeterminisme. Alle andere BIOS-instellingen voor elk van de geteste Intel/AMD-processors waren op hun respectievelijke standaardwaarden. Zowel 1P-als 2P-tests werden uitgevoerd op alle beschikbare geteste processors.

Gezien mijn gebruikelijke”bleeding edge”en toekomstgerichte focus, werden al deze benchmarks uitgevoerd van Ubuntu 22.10 met zijn GCC 12.2-voorraadcompiler. Voor een frisse kernel-look was Linux 6.0 in gebruik. Deze zelfde softwarestack werd gebruikt voor alle geteste servers/processors. Elk van de configuraties draaide met geheugen op de maximale nominale snelheid en geheugenkanaalconfiguratie. Alle CPU’s zijn getest met behulp van de”performance”CPU-frequentieschaalregelaar.

Ubuntu 22.04 LTS is echter ook in goede staat voor EPYC Genua en ik heb tests uitgevoerd met deze EPYC 9004-serie processors op Ubuntu 22.04 met zijn Linux 5.15-kernel, maar voor mijn kijk op de Linux-prestaties vooruitkijkend en de allernieuwste upstream-software willen gebruiken, werd deze benchmarkingronde gedaan met Ubuntu 22.10 + Linux 6.0 voor alle geteste serverprocessors.

Het is geen echte verrassing dat de AMD EPYC 9004″Genua”processorondersteuning voor Linux in goede staat is voor lancering. Het gebruik van een distributie met een recente versie van de Linux-kernel (of een zakelijke Linux-distributie met back-ported/gepatchte kernels) zou in goede staat moeten zijn voor deze Zen 4-serverprocessors. Er zijn enkele functies die pas onlangs zijn geland, zoals de bijgewerkte Last Branch Record-verwerking, maar alle belangrijke functionaliteit is al aanwezig-inclusief bewaking van temperatuur en stroomverbruik. Aan de compilerkant is de ondersteuning voor Zen 4 (znver4) traag. AMD heeft pas onlangs hun eerste Znver4-inschakelingspatch gepost terwijl ze de kostentabellen van Znver3 overnamen. Die eerste ondersteuning is te vinden in GCC 13, die in de eerste maanden van volgend jaar uitkomt en de LLVM/Clang 16.0-ondersteuning is in behandeling. AMD zal naar verwachting binnenkort een nieuwe AOCC-release uitbrengen voor hun AMD Optimizing C/C++ Compiler met Zen 4-optimalisaties.

Tijdens de benchmarking werd een brede selectie van server/HPC-benchmarks uitgevoerd, terwijl ook de CPU-kracht werd gecontroleerd verbruik van de blootgestelde RAPL-interfaces en het leveren van prestatie-per-Watt-statistieken per benchmark en meer.

Meteen met het opstarten van enkele HPC-benchmarks, tonen de AMD EPYC Genoa-processors hun bekwaamheid voor prestaties. De AMD EPYC 9654 2P had een 40% lagere runtime voor de GPAW DFT-code in vergelijking met de EPYC 7773X Milan-X en naderde het punt om bijna twee keer zo snel te zijn als de EPYC 7763-processors. Bij het overschakelen naar de power determinism-modus, werden er meer prestaties uit de EPYC Genoa-processors geperst. Het zijn gewoon niet de 96 cores versus 64 cores die leidden tot de grote verbetering met Genua, aangezien de 64-core EPYC 9554 1P2P-prestaties ook geweldig waren-de EPYC 9554 kwam overeen met de EPYC 7763 2P-prestaties voor GPAW!

Maar , natuurlijk verbruiken deze nieuwe EPYC 9554/9654-processors meer stroom dan hun voorgangers, zoals te verwachten is.

Op een prestatie-per-dollar-basis presteren de nieuwe EPYC 9554/9654-processors vrij goed tegen de onderdelen van de vorige generatie. Dat zijn natuurlijk alleen de CPU-prijzen, maar er zijn ook de DDR5-geheugenprijzen en de platformprijzen om te overwegen, maar het was niet mogelijk om daar vóór de lancering nauwkeurige beoordelingen te maken om te zien hoe de prijzen van Genoa-moederborden, enz. naar Milaan(X).

De prestaties van AMD EPYC 9654 en EPYC 9554 waren even geweldig met de GROMACS-benchmark voor moleculaire dynamica. De prestaties van de EPYC 9654 2P waren 1,66x de snelheid van de EPYC 7773X 2P en de EPYC 9654 1P-configuratie kwam bijna overeen met de prestaties van de EPYC 7773X 2P… Er is een aanzienlijke verbetering dankzij de extra cores, DDR5-systeemgeheugen, 12 geheugenkanalen, AVX-512, en andere Zen 4 architectonische verbeteringen. En als het in de vermogensdeterminisme-modus draait, nog betere prestaties.

Hoewel het energieverbruik van de EPYC Genua hoger was dan bij de EPYC Milan(X) en Xeon Ice Lake, op een prestatie-per-Watt-basis voor GROMACS efficiëntie wordt gevonden met Genua. Intel’s vlaggenschip Xeon Platinum 8380-processors waren gewoon niet concurrerend met Genua en hadden het in de meeste benchmarks moeilijk genoeg om tegen Milan(X) te presteren, maar Xeon Sapphire Rapids zal hopelijk volgend kwartaal arriveren.

De prestatie-per-dollarstatistieken op basis van de CPU-prijsstelling brengen Genua in goede vorm.

De geteste EPYC Genua-processors presteerden ongelooflijk met NAMD en leverden geweldige resultaten op generatiebasis van Milaan/Milaan-X en vergrootten de voorsprong op de huidige generatie Xeon Ice Lake-processors.

AMD EPYC Genoa presteerde geweldig met de Graph500-benchmark.

De EPYC 9654/9554-resultaten waren ook verbluffend voor de HPCG-benchmark. Simpel gezegd, de AMD EPYC 9004-serie leverde via een breed scala aan benchmarks consequent een ongekende prestatie-upgrade.

De EPYC 9554-en EPYC 9654-processors vertoonden fenomenale prestaties bij weersvoorspellingen met behulp van WRF. De stijging van niet alleen de EPYC 7773X/7763 naar EPYC 9654 was onthutsend, maar zelfs de 64-core EPYC 9554 was een enorm voordeel dankzij AVX-512 en andere verbeteringen ten opzichte van eerdere Zen 3-serverprocessors.

Aan een prestatie-per-dollar basis met WRF, de EPYC Genua-processors bleven schitteren.

Met RELION was de generatieverbetering minder maar nog steeds significant van Milaan(X) tot Genua.

AMG was een van de weinige benchmarks waar de Xeon Platinum 8362/8380 Ice Lake-processors een voorsprong konden nemen op de vlaggenschipprocessors van EPYC Milan, maar dat was niet langer het geval bij Genua.

Hoewel de EPYC een hoger stroomverbruik heeft, Genoa-processors leverden een geweldige energie-efficiëntie.

Over een breed scala van HPC-benchmarks waren de prestaties van de EPYC Genoa-processor gewoon fenomenaal. De afgelopen weken met EPYC Genoa waren enkele van de meest overtuigende prestatiebenchmarkresultaten die ik de afgelopen 18+ jaar heb gezien met de ongelooflijke generatieverbetering, terwijl het nog steeds toonaangevende energie-efficiëntie en waarde leverde.

Overal een breed assortiment van HPC-benchmarks, de EPYC 9654-en 9554-configuraties boden geweldige prestaties in de standaard prestatiedeterminismemodus.

OpenVINO voor Intel’s open-source AI-softwareproject presteerde geweldig op de AMD EPYC 9004″Genua”-processors met AVX-512. De Xeon Platinum 8362/8380-processors leverden betere prestaties dan de Milan/Milan-X CPU’s dankzij AVX-512, maar de efficiënte AVX-512-implementatie van Genua leidde nu tot veel hogere prestaties met OpenVINO.

De verbetering met OpenVINO voor Genua is zo dramatisch dat de prestatie-per-dollarwaarde veel hoger ligt dan die van bestaande Intel/AMD-CPU’s.

OpenVINO was een bolwerk voor Intel Xeon Scalable”Ice Lake”boven Milaan/Milaan-X maar de EPYC 9554″Genua”-processor kan zelfs concurreren met twee Xeon Platinum 8380-processors. De prestaties van Genua zijn waanzinnig.

Over de vele verschillende geteste modellen presteerde OpenVINO 2022 uitstekend met EPYC Genua-processors dankzij de AVX-512-ondersteuning. Hoewel ik me aanvankelijk zorgen maakte over de AVX-512-implementatie van de Zen 4 met een 256-bits datapad, heeft deze bewezen zeer goed te presteren en zonder de stroom/thermische implicaties van AVX-512 op eerdere Intel-CPU’s.

De EPYC Genua-processors presteerden ook erg goed met Intel’s oneDNN diepe neurale netwerkbibliotheek die uitgebreid gebruik kan maken van AVX-512.

Zelfs voor”eenvoudig”werk zoals codecompilatie over meerdere taken om de CPU’s, de prestaties van de AMD EPYC 9004-serie leverden nog steeds aanzienlijke generatieverbeteringen ten opzichte van Milaan.

Het voordeel van de kerntelling met AMD EPYC helpt ook en is een gebied waar EPYC Genua nog steeds de leiding zal nemen over Intel’s aankomende Sapphire Rapids-processors.

De nieuwe geavanceerde Genoa-processors kunnen een standaard Linux x86_64-kernel in minder dan 20 seconden compileren!

Of het bouwen van een volledige kernel met alle beschikbare kernelmodules kan in onder twee minuten.

Op een prestatie-per-dollar basis, het resultaat van EPYC Genua s waren vergelijkbaar met de huidige prijs voor waarde in Milaan als je geïnteresseerd bent in een codecompilatie build farm/CI-server.

Voor CPU-gebaseerde renderfarms, AMD EPYC Genua met maximaal 96 cores en de ontwerpverbeteringen ten opzichte van Zen 3 wierpen hun vruchten af ​​met aanzienlijke verbeteringen in de weergavetijd. Met de bekende BMW-scene kon de vlaggenschip EPYC 9654 2P-processor het in slechts 8 seconden renderen!

AMD EPYC Genoa presteerde erg goed met Blender 3.3 met grote generatieverbeteringen en veel betere prestaties dan wat kan worden bereikt met Xeon Scalable Ice Lake en zijn veel lagere kerntellingen.

De power determinism-modus kan nog meer helpen met de rendertijden van de Blender, als je het verhoogde vermogen/thermische impact niet erg vindt.

Op een prestatie-per-dollar basis zijn de nieuwe Genua CPU’s qua prijs in ieder geval qua prijs vergelijkbaar met Milaan.

Intel’s Embree ray-tracing kernels kunnen aanzienlijk profiteren van Genua met AVX-512. De EPYC 9654 2P in vermogensdeterminisme-modus was tweemaal de snelheid van de AMD EPYC 7773X 2P-processor.

Hoewel deze geteste Genua-processors een hoger stroomverbruik hebben dan Milaan, op een prestatie-per-Watt-basis deden ze veel beter dan de andere Intel/AMD CPU’s.

Genua presteerde goed in de andere AVX-512-geoptimaliseerde Intel-softwarecomponenten die deel uitmaken van hun oneAPI-collectie.

De OSPRay-straal-tracing-engine had enkele overwinningen met de Xeon Platinum 8380/8662-processors op Milaan/Milaan-X, maar dat is niet langer het geval met Genua. Omdat OSPRay goed is geoptimaliseerd door Intel voor AVX-512-gebruik op hun Xeon-CPU’s, presteert het even goed met AMD’s nieuwe AVX-512-serverprocessors.

Voor CPU-gebaseerde renderingworkloads waren de Genoa-resultaten geweldig, vooral in gevallen zoals een enkele EPYC 9654 die beter presteert dan een 2P EPYC 7773X-of 2P 7763-configuratie.

In een single-threaded Node.js-benchmark kon Genoa nu voor Ice Lake uitkomen dankzij de Zen 4 architecturale verbeteringen.

De simdjson JSON parsing benchmark is normaal gesproken niet interessant voor grote serverprestaties, maar het is nu dat simdjson een AVX-512 geoptimaliseerd pad heeft. De processors uit de EPYC 9004-serie waren Ice Lake nu ver voor dankzij de Zen 4 AVX-512-ondersteuning.

Het stroomverbruik was ook vergelijkbaar met Ice Lake, waarbij de CPU’s niet volledig verzadigd waren voor de JSON-parsing-benchmark.

De EPYC 9554 leverde de beste prestaties per watt voor deze AVX-512-compatibele parseertest voor gigabytes aan JSON-gegevens.

Ook de single-threaded Python-prestatietests toonde de mooie vorderingen met Zen 4.

En een aantal zeer mooie verbeteringen voor Numpy.

De single-threaded PHP-prestaties van Genua waren nu in een staat die alleen vergelijkbaar is met die van Ice Lake , maar voor een volledig geladen webserver is er natuurlijk meer capaciteit te vinden met de Genua en zijn hogere core/thread counts.

Over meer algemene workloads zoals bestands-/datacompressie, Zen 4 met Genua levert een aantal mooie stapsgewijze verbeteringen ten opzichte van Zen 3.

Genua behaalde een aantal geweldige overwinningen met BRL-CAD.

Er was een aanzienlijke generatieverhoging om van te genieten y met Genoa voor de Liquid-DSP open-source digitale signaalverwerkingssoftware.

Om een ​​lang verhaal kort te maken, van ongeveer 200 verschillende benchmarks die ik heb uitgevoerd, waren de AMD EPYC 9654-en EPYC 9554-processors een doorslaand succes. Ze zorgden voor een geweldige generatieverbetering in het algemeen, maar vooral in de vele HPC/server-workloads die AVX-512 konden gebruiken, en op hun beurt vergrootten ze AMD’s voorsprong op de huidige Xeon Scalable”Ice Lake”-processors.

De OpenFOAM-resultaten met EPYC Genua was fantastisch voor open-source computationele vloeistofdynamica (CFD).

Altair’s OpenRadioss ziet er ook erg goed uit op Genua. (Niet alle CPU’s zijn hier getest omdat die nieuwe benchmark laat aan de testbeoordelingscyclus is toegevoegd. Maar gezien de interesse van dit nieuwe open-sourceproject van Altair, volgen hier de referentiepunten voor de geteste CPU’s.)

Degenen die alle benchmarks willen zien die ik volledig heb uitgevoerd, kunnen dat doen via