Der EPYC 9654 ist AMDs neuer Flaggschiff-Prozessor mit sportlichen 96 Kernen/192 Threads, a 2,4 GHz Basistakt mit 3,7 GHz Boost-Takt und hat eine TDP von 360 Watt. Die konfigurierbare TDP auf diesem einzelnen 96-Core-Teil liegt zwischen 320 und 400 Watt.
Der EPYC 9554 ist mittlerweile AMDs höherwertiger 64-Core-Teil gegenüber dem EPYC 9534. Der EPYC 9554 verfügt über 64 Kerne/128 Threads mit einem Basistakt von 3,1 GHz und einem Boost-Takt von 3,75 GHz, während er eine TDP von 360 Watt wie der EPYC 9654 hat. Wie der EPYC 9654 kann die cTDP von 320 bis 400 Watt eingestellt werden. Der aktuelle Flaggschiff-Prozessor von Milan, der EPYC 7763, hat zur Erinnerung 64 Kerne/128 Threads mit einem Basistakt von 2,45 GHz und einem maximalen Boost-Takt von 3,5 GHz. Oder auf der Milan-X-Seite ist der EPYC 7773X mit einem Basistakt von 2,2 GHz und einem maximalen Boost-Takt von 3,5 GHz, während er über 768 MB L3-Cache verfügt.
Der AMD EPYC 9374F 32-Core-Hochfrequenzteil, der in seinem separaten Test auftaucht, hat einen Basistakt von 4,05 GHz und einen Boost von 4,3 GHz bei einer TDP von 320 Watt.
Der EPYC 9654 hat einen Der Einführungspreis liegt bei etwa 11.805 US-Dollar, der EPYC 9554 kostet etwa 9.087 US-Dollar und der EPYC 9374F etwa 4.850 US-Dollar.
Ein Größenvergleich von AMD Milan SP3 auf AMD Genoa SP5.
AMD stellte freundlicherweise die Titanite-Referenzplattform und die EPYC 9004 Genoa-Prozessoren für diese Überprüfung und das Linux-Benchmarking zur Verfügung. Für den heutigen Launch-Review gehörten zu den getesteten Serverprozessoren:
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Alle diese Prozessoren wurden unter Verwendung von Ubuntu 22.10 mit Linux 6.0-Kernel und GCC frisch getestet/erneut getestet 12. Weitere Details zum Software-Stack weiter unten.
Für die neuen EPYC Genoa-Prozessoren habe ich die EPYC 9554 und 9654 sowohl im standardmäßigen”Performance”-Determinismus-Modus als auch in getestet die BIOS-Umschaltung in den”Power”-Determinismusmodus für diejenigen, die neugierig auf die Gesamtleistungsauswirkung der Determinismussteuerung vom BIOS sind. Das „-Power“-Suffix Genoa ergibt beim Betrieb im Power-Determinismus-Modus über dem Default-Performance-Determinismus. Alle anderen BIOS-Einstellungen für jeden der getesteten Intel/AMD-Prozessoren waren auf ihren jeweiligen Standardwerten. Sowohl 1P-als auch 2P-Tests wurden auf allen verfügbaren getesteten Prozessoren durchgeführt.
Angesichts meines üblichen”Bleeding Edge”und zukunftsweisenden Fokus wurden alle diese Benchmarks durchgeführt von Ubuntu 22.10 mit seinem GCC 12.2 Stock Compiler. Für einen frischen Kernel-Look kam Linux 6.0 zum Einsatz. Derselbe Software-Stack wurde für alle getesteten Server/Prozessoren verwendet. Jede der Konfigurationen wurde mit Speicher mit maximaler Nenngeschwindigkeit und Speicherkanalkonfiguration ausgeführt. Alle CPUs wurden mit dem „Performance“-CPU-Frequenzskalierungsregler getestet.
Ubuntu 22.04 LTS ist jedoch auch für EPYC Genoa in guter Verfassung, und ich habe Tests dieser Prozessoren der EPYC 9004-Serie auf Ubuntu 22.04 durchgeführt sein Linux 5.15-Kernel, aber für meinen Blick auf die Linux-Leistung, um vorausschauend zu schauen und die allerneueste Upstream-Software verwenden zu wollen, wurde diese Benchmark-Runde mit Ubuntu 22.10 + Linux 6.0 für alle getesteten Serverprozessoren durchgeführt.
Keine wirkliche Überraschung, die AMD EPYC 9004 „Genoa“ Prozessorunterstützung für Linux ist für den Start in guter Verfassung. Die Verwendung einer Distribution mit einer neueren Version des Linux-Kernels (oder einer Enterprise-Linux-Distribution mit ihren rückportierten/gepatchten Kerneln) sollte für diese Zen 4-Serverprozessoren in gutem Zustand sein. Es gibt einige Funktionen, die erst vor kurzem gelandet sind, wie die aktualisierte Handhabung von Last Branch Record, aber alle wichtigen Funktionen sind bereits vorhanden – einschließlich Temperatur-und Stromverbrauchsüberwachung. Auf der Compiler-Seite ist die Unterstützung von Zen 4 (znver4) verspätet. AMD hat erst kürzlich seinen ersten Znver4-Enablement-Patch veröffentlicht und dabei die Kostentabellen von Znver3 übernommen. Diese anfängliche Unterstützung wird in GCC 13 zu finden sein, das in den ersten Monaten des nächsten Jahres erscheinen soll, und die Unterstützung für LLVM/Clang 16.0 steht noch aus. AMD wird voraussichtlich in Kürze eine neue AOCC-Version für ihren AMD Optimizing C/C++ Compiler mit Zen 4-Optimierungen herausgeben.
Während des Benchmarkings wurde eine große Auswahl an Server/HPC-Benchmarks durchgeführt, während auch die CPU-Leistung überwacht wurde Verbrauch von den exponierten RAPL-Schnittstellen und Bereitstellung von Leistungs-pro-Watt-Metriken pro Benchmark und mehr.
Gleich beim Start einiger HPC-Benchmarks zeigen die AMD EPYC Genoa Prozessoren ihre Leistungsfähigkeit. Der AMD EPYC 9654 2P hatte im Vergleich zum EPYC 7773X Milan-X eine um 40 % geringere Laufzeit für den GPAW-DFT-Code und näherte sich dem Punkt, an dem er fast doppelt so schnell war wie die EPYC 7763-Prozessoren. Beim Umschalten in den Power-Determinismus-Modus wurde mehr Leistung aus den EPYC Genoa-Prozessoren gequetscht. Es sind nicht nur die 96 Kerne gegenüber 64 Kernen, die zu dem großen Aufschwung mit Genoa führten, da die Leistung des 64-Kern EPYC 9554 1P2P ebenfalls herausragend war – der EPYC 9554 erreichte die Leistung des EPYC 7763 2P für GPAW!
Aber Natürlich verbrauchen diese neuen EPYC 9554/9654 Prozessoren erwartungsgemäß mehr Strom als ihre Vorgänger.
Auf einer Performance-per-Dollar-Basis schneiden die neuen EPYC 9554/9654 Prozessoren recht gut ab gegen die Teile der vorherigen Generation. Natürlich sind das nur die CPU-Preise, aber es sind auch die DDR5-Speicherpreise und die Plattformpreise zu berücksichtigen, aber es war nicht möglich, vor dem Start genaue Einschätzungen zu treffen, um zu sehen, wie sich die Preise für Genoa-Motherboards usw. vergleichen lassen nach Milan(X).
Die Leistung von AMD EPYC 9654 und EPYC 9554 war beim GROMACS-Molekulardynamik-Benchmark gleichermaßen hervorragend. Die Leistung des EPYC 9654 2P war 1,66-mal so schnell wie die des EPYC 7773X 2P, und die Konfiguration des EPYC 9654 1P entsprach fast der Leistung des EPYC 7773X 2P… Dank der zusätzlichen Kerne, des DDR5-Systemspeichers, der 12 Speicherkanäle und des AVX gibt es eine erhebliche Steigerung-512 und andere Architekturverbesserungen von Zen 4. Und wenn es im Power-Determinismus-Modus läuft, sogar noch höhere Leistung.
Während der Stromverbrauch des EPYC Genoa höher war als bei EPYC Milan(X) und Xeon Ice Lake, auf einer Leistung-pro-Watt-Basis für GROMACS Effizienz findet man bei Genua. Intels Flaggschiff-Prozessoren Xeon Platinum 8380 waren einfach nicht konkurrenzfähig mit Genoa und hatten es schwer genug, in den meisten Benchmarks gegen Milan(X) anzutreten, aber zumindest Xeon Sapphire Rapids wird hoffentlich im nächsten Quartal eintreffen.
Die Leistung pro-Dollar-Metriken basierend auf den CPU-Preisen versetzen Genoa in eine gute Verfassung.
Die getesteten EPYC Genoa-Prozessoren zeigten eine unglaubliche Leistung mit NAMD und lieferten Generation für Milan/Milan-X hervorragende Ergebnisse und vergrößerten den Vorsprung gegenüber der aktuellen Generation Xeon Ice Lake-Prozessoren.
AMD EPYC Genoa hat beim Graph500-Benchmark hervorragend abgeschnitten.
Die EPYC 9654/9554-Ergebnisse waren auch beim HPCG-Benchmark umwerfend. Einfach ausgedrückt, die AMD EPYC 9004-Serie lieferte in einer Vielzahl von Benchmarks durchweg eine beispiellose Leistungssteigerung.
Die EPYC 9554-und EPYC 9654-Prozessoren zeigten eine phänomenale Leistung bei Wettervorhersagen mit WRF. Der Aufstieg nicht nur vom EPYC 7773X/7763 zum EPYC 9654 war überwältigend, sondern sogar der 64-Kern-EPYC 9554 war dank AVX-512 und anderer Verbesserungen gegenüber früheren Zen 3-Serverprozessoren von großem Vorteil.
Ein Auf einer Leistung-pro-Dollar-Basis mit WRF glänzten die EPYC Genoa-Prozessoren weiter.
Mit RELION war die Generationsverbesserung von Milan(X) bis Genoa geringer, aber immer noch signifikant.
AMG war einer der wenigen Benchmarks, bei denen die Xeon Platinum 8362/8380 Ice Lake-Prozessoren die Flaggschiff-Prozessoren von EPYC Milan überholen konnten, aber das war bei Genoa nicht mehr der Fall.
Obwohl der EPYC Genoa-Prozessoren lieferten eine hervorragende Energieeffizienz.
In einer Vielzahl von HPC-Benchmarks war die Leistung des EPYC Genoa-Prozessors einfach phänomenal. Die letzten paar Wochen des Betriebs von EPYC Genoa waren einige der überzeugendsten Leistungsbenchmark-Ergebnisse, die ich in den letzten 18+ Jahren gesehen habe, mit dem unglaublichen Generationsschub und gleichzeitig führender Energieeffizienz und Wert.
Across eine große Auswahl an HPC-Benchmarks, die EPYC 9654-und 9554-Konfigurationen boten im Standard-Leistungsdeterminismusmodus eine hervorragende Leistung.
OpenVINO für Intels Open-Source-KI-Softwareprojekt schnitt auf dem AMD EPYC 9004″Genua”hervorragend ab”Prozessoren mit AVX-512. Die Xeon Platinum 8362/8380-Prozessoren lieferten dank AVX-512 eine bessere Leistung gegenüber den Milan/Milan-X-CPUs, aber die effiziente AVX-512-Implementierung von Genoa führte jetzt mit OpenVINO zu einer weitaus höheren Leistung.
Die Steigerung mit OpenVINO für Genoa ist so dramatisch, dass der Wert der Leistung pro Dollar weit über dem von bestehenden Intel/AMD-CPUs liegt.
OpenVINO war eine Hochburg für Intel Xeon Scalable „Ice Lake“ gegenüber Milan/Milan-X aber der EPYC 9554 „Genoa“ Prozessor kann sogar mit zwei Xeon Platinum 8380 Prozessoren mithalten. Die Leistung von Genua ist überwältigend.
Über die vielen verschiedenen getesteten Modelle hinweg hat OpenVINO 2022 dank der AVX-512-Unterstützung mit EPYC Genoa-Prozessoren hervorragend abgeschnitten. Während ich anfangs besorgt über die AVX-512-Implementierung von Zen 4 war, die einen 256-Bit-Datenpfad verwendet, hat sie sich als sehr gut und ohne die Leistungs-/Wärmeauswirkungen von AVX-512 auf früheren Intel-CPUs erwiesen.
Die EPYC Genoa-Prozessoren schnitten auch sehr gut mit Intels OneDNN Deep Neural Network Library ab, die in der Lage ist, AVX-512 umfassend zu nutzen.
Sogar für”einfache”Arbeiten wie Codekompilierung über mehrere Jobs hinweg zu sättigen CPUs lieferte die Leistung der AMD EPYC 9004-Serie immer noch beträchtliche Generationsverbesserungen gegenüber Milan.
Der Vorteil der Kernzahl bei AMD EPYC hilft ebenfalls und ist ein Bereich, in dem EPYC Genoa immer noch gegenüber Intels kommenden Sapphire Rapids-Prozessoren führen wird.
Die neuen High-End-Genoa-Prozessoren können einen Standard-Linux-x86_64-Kernel-Build in weniger als 20 Sekunden kompilieren!
Oder das Erstellen eines vollständigen Kernels mit allen verfügbaren Kernel-Modulen kann unter ausgeführt werden zwei Minuten.
Auf Performance-pro-Dollar-Basis das Ergebnis von EPYC Genoa s waren vergleichbar mit den aktuellen Mailand-Preisen für den Wert, wenn Interesse an einer Code-Compilation Build-Farm/CI-Server besteht.
Für CPU-basierte Renderfarmen, AMD EPYC Genoa mit bis zu 96 Kernen und den Designverbesserungen gegenüber Zen 3 zahlten sich mit erheblichen Verbesserungen der Renderzeit aus. Mit der bekannten BMW-Szene konnte der Flaggschiff-Prozessor EPYC 9654 2P es in nur 8 Sekunden rendern!
AMD EPYC Genoa schnitt mit Blender 3.3 sehr gut ab, mit großen Generationsverbesserungen und viel besserer Leistung als das, was es kann mit Xeon Scalable Ice Lake und seinen viel geringeren Kernzahlen erreicht werden.
Der Power-Determinismus-Modus kann bei den Blender-Renderzeiten noch mehr helfen, wenn Sie die erhöhte Leistung/thermische Auswirkung nicht stören.
Auf einer Performance-pro-Dollar-Basis sind die neuen Genoa-CPUs zumindest auf CPU-Basis preislich sehr vergleichbar mit Milan.
Intels Embree-Raytracing-Kernel können erheblich davon profitieren Genua mit AVX-512. Der EPYC 9654 2P im Energie-Determinismus-Modus war doppelt so schnell wie der AMD EPYC 7773X 2P-Prozessor.
Obwohl diese getesteten Genoa-Prozessoren einen höheren Stromverbrauch als Milan haben, war dies auf einer Leistung-pro-Watt-Basis der Fall viel besser als die anderen Intel/AMD-CPUs.
Genoa schnitt in den anderen AVX-512-optimierten Intel-Softwarekomponenten, die Teil ihrer oneAPI-Sammlung sind, gut ab.
Der OSPRay-Strahl-tracing engine hatte einige Siege mit den Xeon Platinum 8380/8662 Prozessoren gegenüber Milan/Milan-X, aber das ist bei Genoa nicht mehr der Fall. Da OSPRay von Intel für die AVX-512-Nutzung auf ihren Xeon-CPUs gut optimiert wurde, funktioniert es genauso gut mit den neuen AVX-512-Serverprozessoren von AMD.
Für CPU-basierte Rendering-Workloads waren die Genoa-Ergebnisse besonders hervorragend in Fällen wie einem einzelnen EPYC 9654 in der Lage, einen 2P EPYC 7773X oder 2P 7763 Konfigurationen zu übertreffen.
In einem Single-Threaded Node.js-Benchmark konnte sich Genoa dank der jetzt vor Ice Lake durchsetzen Verbesserungen der Architektur von Zen 4.
Der simdjson JSON-Parsing-Benchmark ist normalerweise nicht interessant für die Leistung großer Server, aber jetzt hat simdjson einen für AVX-512 optimierten Pfad. Die Prozessoren der EPYC 9004-Serie waren jetzt dank der Zen 4 AVX-512-Unterstützung deutlich vor Ice Lake.
Der Stromverbrauch war auch vergleichbar mit Ice Lake, wobei die CPUs für den JSON-Parsing-Benchmark nicht vollständig ausgelastet waren.
Der EPYC 9554 lieferte die beste Leistung pro Watt für diesen AVX-512-fähigen Analysetest für Gigabytes von JSON-Daten.
Die Singlethread-Python-Leistungstests ebenfalls zeigte die netten Fortschritte mit Zen 4.
Und einige sehr nette Verbesserungen für Numpy.
Die Singlethread-PHP-Leistung von Genoa war jetzt in einem Zustand, der nur mit dem von Ice Lake vergleichbar war , aber für einen voll ausgelasteten Webserver gibt es natürlich mehr Kapazität mit dem Genoa und seinen höheren Kern-/Thread-Anzahlen.
Für häufigere Workloads wie Datei-/Datenkomprimierung Zen 4 mit Genoa liefert einige schöne inkrementelle Verbesserungen gegenüber Zen 3.
Genoa sammelte einige herausragende Siege mit BRL-CAD.
Es gab einen signifikanten Generationsschub zum Genießen y mit Genoa für die Open-Source-Digitalsignalverarbeitungssoftware Liquid-DSP.
Kurz gesagt, aus rund 200 verschiedenen Benchmarks, die ich durchgeführt habe, waren die Prozessoren AMD EPYC 9654 und EPYC 9554 ein durchschlagender Erfolg. Sie lieferten insgesamt, aber insbesondere in den vielen HPC/Server-Arbeitslasten, die AVX-512 nutzen konnten, einen großartigen Generationsschub und vergrößerten damit den Vorsprung von AMD gegenüber den aktuellen Xeon Scalable „Ice Lake“-Prozessoren.
Die OpenFOAM-Ergebnisse mit EPYC Genua war fantastisch für Open-Source-Computational Fluid Dynamics (CFD).
Altairs OpenRadioss sieht auf Genua ebenfalls sehr gut aus. (Nicht alle CPUs wurden hier getestet, da dieser neue Benchmark erst spät zum Testüberprüfungszyklus hinzugefügt wurde. Angesichts des Interesses dieses neuen Open-Source-Projekts von Altrair sind hier jedoch die Referenzpunkte für die getesteten CPUs aufgeführt.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Oben sehen Sie den kombinierten Stromverbrauch, der für alle getesteten Prozessorkonfigurationen für die gesamte Dauer der durchgeführten Benchmarks beobachtet wurde. Auch hier stammen alle CPU-Leistungsmessungen von den exponierten RAPL-Schnittstellen unter Linux. Der EPYC 9554 hatte in seinem Standardmodus (Leistungsdeterminismus) eine durchschnittliche Leistungsaufnahme von 221 Watt mit einem Spitzenwert von 355 Watt, verglichen mit dem EPYC 7763 mit einem Durchschnitt von 170 Watt und einem Spitzenwert von 286 Watt, aber wenn der Leistungsdeterminismusmodus aktiviert wurde sprang auf einen Durchschnitt von 234 Watt mit einer Spitze von 404 Watt. Währenddessen hatte das Flaggschiff EPYC 9654 mit 96 Kernen eine durchschnittliche Leistungsaufnahme von 223 Watt und einen Spitzenwert von 363 Watt oder einen Durchschnitt von 256 Watt im Leistungsdeterminismusmodus und einen Spitzenwert von 415 Watt. Im EPYC 9654 2P Modus waren das durchschnittlich 366 Watt und in der Spitze 697 Watt oder im Power determinism mode durchschnittlich 443 Watt und in der Spitze 833 Watt. Der Stromverbrauch ist bei diesen neuen Sockel-SP5-Prozessoren höher, aber wie viele der Leistungs-pro-Watt-Metriken zeigen, liegt er in Bezug auf die Energieeffizienz oft vor dem AMD EPYC 7003 „Milan“ oder im schlimmsten Fall in etwa bei ähnlicher Leistung. pro Watt zu diesen Teilen der vorherigen Generation. Die Leistungssteigerungen sind also gerechtfertigt und es gibt auch niedrigere EPYC 9004″Genoa”Prozessoren, wenn man nicht in den 300~400 Watt Bereich kommen will.
Wenn man das geometrische Mittel aller erfolgreich gelaufenen Benchmarks nimmt alle Prozessoren, hier ist, wie sich die Dinge entwickeln. Sogar ein einzelner EPYC 9554 übertrifft die 2P EPYC 7773X-Konfiguration insgesamt… AMD EPYC der 4. Generation ist großartig mit seiner AVX-512-Implementierung, DDR5-Systemspeicher, zwölf Speicherkanälen und anderen Zen 4-Architekturverbesserungen. Der EPYC 9554 2P mit 64 Kernen war insgesamt 64 % schneller als die Konfiguration EPYC 7763 2P mit 64 Kernen oder 67 %, wenn der EPYC 9554 2Ps im Power-Determinismus-Modus ausgeführt wurde. Unterdessen war das Flaggschiff EPYC 9654 2P 74 % schneller als das EPYC 7763 2P oder das stieg auf 85 %, wenn die Genoa-Flaggschiff-CPUs im Power-Determinismus-Modus liefen. Der AMD EPYC 9654 2P lief mit mehr als der doppelten Geschwindigkeit von Intels aktuellem Flaggschiff, den Xeon Scalable 8380 2P „Ice Lake“-Prozessoren.
Der Generationswechsel von Mailand nach Genua war unglaublich über die breite Palette von Server-und HPC-Benchmarks, die ich durchgeführt habe. Ich muss jetzt darüber träumen, wie Genoa-X nächstes Jahr aussehen wird, da ich weiß, dass es noch mehr Potenzial gibt, Zen 4 auf der Serverseite sowie die Bergamo-CPUs des nächsten Jahres für bis zu 128 Kerne für die Cloud herauszuholen Computing-Workloads.
Wie ich bereits viel auf der Desktop-Seite der Ryzen 7000-Serie gezeigt habe, ist die AVX-512-Implementierung von AMD Zen 4 bemerkenswert effizient, und das gilt noch mehr auf der Serverseite. Da es hier sogar noch mehr relevante Arbeitslasten gibt, die AVX-512 nutzen können, und eine erstaunliche Verbesserung, wie in diesen Benchmarks gezeigt wird.
Auf CPU-Preisbasis ist die EPYC 9004-Serie mit der bestehenden EPYC 7003 konkurrenzfähig. Milan(X)”-Prozessoren und Xeon Scalable Ice Lake-Prozessoren. Der Übergang zu Genua bedeutet jedoch auch, dass DDR5-ECC-Systemspeicher benötigt wird, der teurer ist als DDR4. Ich habe noch keine erweiterten Preisinformationen zu EPYC Genoa-Einzelhandels-Motherboards erhalten, daher bin ich mir nicht sicher, wie sich das auswirken wird, aber vermutlich wird es mit dem komplexeren Sockel SP5 und den höheren Leistungsanforderungen zu höheren relativen Preisen zu dem führen, was wir haben gesehen mit den EPYC SP3 Motherboards. EPYC Milan-Prozessoren werden weiterhin für diejenigen verfügbar sein, die nach preisgünstigeren Servern mit immer noch sehr guter Leistung suchen.
Auf der Seite des Linux-Supports sind der Upstream-Linux-Kernel und andere Schlüssel Komponenten sind in guter Verfassung für die Unterstützung beim Start mit der EPYC 9004-Serie… Zugegeben, das ist bei dem heutigen Marktanteil von Linux-Servern eher eine Selbstverständlichkeit. Aber es gibt noch Raum für AMD, um Fortschritte bei der Linux/Open-Source-Unterstützung zu machen. Zum Beispiel war AMD mit seinen automatischen IBRS-Patches für den Linux-Kernel spät dran, indem es diese erst letzte Woche veröffentlichte. Es ist auch nur mit Linux 6.1, wo das AMD CPU Cache-to-Cache und Speicher-Reporting mit Perf landet, für diejenigen, die an diesen erweiterten Profiling-Fähigkeiten interessiert sind. Ebenfalls erst mit Linux 6.1 wird die LbrExtV2 Last Branch Record-Funktionalität neu in Zen 4 eingeführt. In der Zwischenzeit hat Linux 6.0 AMD X2AVIC für virtuelle KVM-Maschinen verdrängt. Noch nicht in den Linux-Kernel integriert, aber in Patch-Form verfügbar, ist die QoS-Unterstützung für langsame Speicherbandbreitenzuweisung mit CXL-Speicher und die Bandwidth Monitoring Event Configuration (BMEC). Es gibt also ein paar unkritische Funktionen, die für den Mainline-Linux-Kernel verspätet eingetroffen sind, aber zumindest in Bezug auf die gesamte Schlüsselunterstützung ist er für den Start in guter Verfassung. Sobald die Features die Mainline erreichen, gibt es natürlich auch die zusätzliche Zeit, bevor diese Kernel in Verwendung durch verschiedene Linux-Distributionen oder zurückportiert auf die Enterprise-Kernel-Versionen wie RHEL und SLES gefunden werden. Positiv zu vermerken ist, dass sich AMDs Linux-Upstreaming-Trendlinie für das Timing vor der Markteinführung für nachfolgende Generationen von EPYC/Zen-Prozessoren verbessert hat (zum großen Teil, weil sie in den letzten zwei Jahren viel mehr Linux-Ingenieure eingestellt haben).
Es gibt immer noch den unglücklichen Aspekt der wohl späten Compiler-Tuning-Unterstützung für diese neue Generation von Prozessoren. Erst Mitte Oktober verschickte AMD seinen Znver4-Compiler-Support für GCC, der das Target „-march=znver4“ hinzufügte und dann Ende Oktober in GCC 13 Git gemerged wurde. Aber mit dieser anfänglichen Unterstützung wird die Kosten-/Tuning-Tabelle von Znver3 übernommen – das Znver4-Tuning wird „später“ erwartet. Hoffentlich schafft es diese abgestimmte Unterstützung noch rechtzeitig für GCC 13, das seinerseits seine stabile Veröffentlichung als GCC 13.1 etwa im März bis April nächsten Jahres sehen sollte. Aber dann wird es nicht bis zu den meisten Linux-Distributionsversionen von H2’2023 wie Ubuntu 23.10 dauern, bei denen GCC 13 als Standard-Systemcompiler verwendet wird. Hätte AMD seine Znver4-Unterstützung lange vor dem Start in GCC integriert (wie Intel dafür bekannt ist und einen Großteil seiner Sapphire Rapids-und AMX-Befähigung für GCC 12 entfernt hat), könnte es bereits in Ubuntu 22.04 LTS und anderen aktuellen Distributionen ausgeliefert werden. Es gibt auch einen Znver4-Patch für GNU Binutils, der sich auf der Mailingliste befindet und zum Zeitpunkt des Schreibens dieses Artikels noch zusammengeführt werden muss.
Oder anders ausgedrückt, in der jährlichen Compiler-Veröffentlichung GCC 13, wo AMD ist Intel debütierte nur mit der Zen 4-Unterstützung und hat bereits die GCC 13-Unterstützung für verschiedene Prozessoren von 2023 bis 2024 erarbeitet und zusammengeführt. GCC 13 hat bereits Grand Ridge und Granite Rapids, Meteor Lake, Sierra Forest in die Warteschlange gestellt, und dazu gehörte auch die Aktivierung verschiedener neuer Anweisungen, die mit diesen Prozessoren geliefert werden. Es ist diese Art von zeitnaher Unterstützung, die ich gerne von AMD sehen würde (und vor vielen Jahren waren sie mit ihrer frühen GCC-Unterstützung pünktlich), so dass die Znver4-Unterstützung zum Zeitpunkt der Auslieferung dieser Prozessoren idealerweise bereits in einer veröffentlichten/stabiler Compiler, der von den neuesten Linux-Distributionen gefunden wird. Zum jetzigen Zeitpunkt wurden auf der LLVM/Clang-Seite noch keine Znver4-Patches zur Upstream-Überprüfung veröffentlicht, obwohl es mindestens den sechsmonatigen Veröffentlichungsrhythmus gibt. Intel ist in den letzten Jahren in den allermeisten Fällen weiterhin führend auf der Softwareseite, wenn es um sein herausragendes Open-Source/Linux-Timing geht. Das Upstream-Enablement-Timing ist ein wiederkehrendes Ärgernis, das ich bei AMD in jedem Launch-Zyklus habe; Auf der Compiler-Seite ist der einzige logische Grund, den ich habe, dass sie ihre Karten nah an der Weste spielen und neue ISA-Erweiterungspläne für zukünftige CPU-Generationen nicht zu früh enthüllen wollen.
Zugegeben, es sei denn, Sie kompilieren optimiert Code für das Server-CPU-Ziel ist diese Znver4-Compiler-Unterstützung kein großes (oder gar kein) Problem für Sie. Angesichts der wachsenden Attraktivität von AMD im Bereich High Performance Computing (HPC) ist es jedoch ein wenig überraschend, dass sie diese Compiler-Unterstützung nicht früher herausgebracht haben. Es sollte jedoch bald eine neue Version des AMD Optimizing C/C++ Compiler (AOCC) geben, in der Zen 4 in guter Verfassung ist. Sobald diese neue AOCC-Version veröffentlicht ist, werde ich sicherlich einige Compiler-Benchmarks auf Genoa ausführen, um die Auswirkungen der optimierten Compiler-Unterstützung auf diese Zen 4-Serverprozessoren zu untersuchen.
Neben der hervorragenden Leistung und der Linux-Unterstützung zum Start ist ein weiterer spannender Aspekt von EPYC der 4. Generation von der Seite der Referenzplattform Titanite, das mit OpenBMC läuft! Es war aufregend zu sehen, wie das Linux-basierte Open-Source-OpenBMC als Software-Stack für den Referenz-BMC verwendet wird, und hoffentlich wird dies dazu führen, dass OpenBMC von mehr Servern der EPYC 9004-Serie verwendet wird. Außerdem hält hoffentlich das Interesse der Industrie/Kunden an Open-Source-Firmware an und AMD kann sich mehr mit Coreboot und anderen Open-Source-Firmware-Elementen beschäftigen.
Wie gut Intel Sapphire Rapids im Vergleich zu EPYC der 4. Generation abschneidet wird ein interessanter Kampf. Sapphire Rapids wird nur bis zu 60 Kerne erreichen, verglichen mit 96 Kernen bei Genoa, aber zu Intels Vorteil sind die neuen Advanced Matrix Extensions (AMX), AVX-512 FP16 und verschiedene neue Beschleunigerblöcke. Für Software, die AMX und Intels Beschleuniger-IP nutzen kann, wird es zumindest für Genoa eine sehr interessante Konkurrenz sein, aber für traditionellere Server-Workloads wird es eine ziemlich große Herausforderung darstellen – ich muss Sie daran erinnern, dass der Geo-Mittelwert auf dem EPYC 9654 2P doppelt so hoch war des Xeon Platinum 8380 2P. Es wird auch interessant sein zu sehen, wie Intel mit der EPYC 9004-Serie bei der Preisgestaltung konkurriert, insbesondere mit Sapphire Rapids, das Intel On Demand/Software Defined Silicon einführt, was die Preisgestaltung weiter verkompliziert, insbesondere wenn es an die neuen Beschleunigerblöcke gebunden ist, die für die Bereitstellung wettbewerbsfähiger Leistung von größter Bedeutung sind. Ein Bereich, der für Intel mit Sapphire Rapids interessant sein wird, sind ihre HBM2e-SKUs, die jetzt als Xeon Max bekannt sind, während AMD auch nächstes Jahr Genoa-X ankündigen wird. Zu den weiteren Vorteilen der Prozessoren der AMD EPYC-Serie der 4. Generation gehören CXL 1.1+-Unterstützung und erweiterte SEV-SNP-Unterstützung mit erweiterten Speicherverschlüsselungsfunktionen und mehr VMs.