EPYC 9654 je nový vlajkový procesor AMD so športovými 96 jadrami/192 vláknami, Základné hodiny 2,4 GHz s posilňovacími hodinami 3,7 GHz a TDP 360 W. Konfigurovateľné TDP na tejto jedinej 96-jadrovej časti je od 320 do 400 wattov.
EPYC 9554 je medzitým 64-jadrovou časťou AMD vyššej triedy ako EPYC 9534. EPYC 9554 má 64 jadier/128 vlákien so základným taktovaním 3,1 GHz a zosilňovacím taktom 3,75 GHz, pričom má 360 W TDP ako EPYC 9654. Podobne ako EPYC 9654, cTDP možno nastaviť od 320 do 400 Wattov. Aktuálny vlajkový procesor Miláno, EPYC 7763, pre pripomenutie je 64 jadier/128 vlákien so základným taktom 2,45 GHz a maximálnym taktovaním 3,5 GHz. Alebo na strane Milan-X je EPYC 7773X so základným taktom 2,2 GHz a maximálnym zosilnením 3,5 GHz, pričom má 768 MB vyrovnávacej pamäte L3.
AMD EPYC 9374F 32-základná vysokofrekvenčná časť, ktorá prichádza vo svojej samostatnej recenzii, má základné hodiny 4,05 GHz a zosilnenie 4,3 GHz, pričom má TDP 320 wattov.
EPYC 9654 má uvádzacia cena okolo 11 805 USD, EPYC 9554 sa bude predávať za približne 9 087 USD a EPYC 9374F za približne 4 850 USD.
Porovnanie veľkosti AMD Milan SP3 a AMD Genoa SP5.
Spoločnosť AMD láskavo poskytla referenčnú platformu Titanite a procesory EPYC 9004 Genoa pre túto recenziu a testovanie Linuxu. Na dnešnú kontrolu uvedenia na trh testované serverové procesory zahŕňali:
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654-Xeon 2P
br>-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Všetky tieto procesory boli čerstvo testované/znovu testované pomocou Ubuntu 22.10 s jadrom Linux 6.0 a GCC 12. Viac podrobností o softvérovom balíku nižšie.
Pre nové procesory EPYC Genoa som testoval EPYC 9554 a 9654 v predvolenom režime determinizmu „výkonu“, ako aj v BIOS sa prepne do režimu determinizmu „napájanie“ pre tých, ktorí sú zvedaví na celkový vplyv ovládania determinizmu z BIOSu na výkon. Výsledky prípony „-Power“ v Janove sú pri spustení v režime determinizmu výkonu nad predvoleným determinizmom výkonu. Všetky ostatné nastavenia systému BIOS pre každý z testovaných procesorov Intel/AMD boli v príslušných predvolených hodnotách. Testovanie 1P aj 2P sa uskutočnilo na všetkých dostupných testovaných procesoroch.
Vzhľadom na moju zvyčajnú „nenávisť“ a zameranie na budúcnosť boli všetky tieto benchmarky vykonané z Ubuntu 22.10 s kompilátorom akcií GCC 12.2. Pre nový vzhľad jadra sa používal Linux 6.0. Rovnaký softvérový balík bol použitý na všetkých testovaných serveroch/procesoroch. Každá z konfigurácií bežala s pamäťou pri maximálnej menovitej rýchlosti a konfiguráciou pamäťového kanála. Všetky procesory boli testované pomocou „výkonného“ regulátora škálovania frekvencie CPU.
Ubuntu 22.04 LTS je však v dobrom stave aj pre EPYC Genoa a vykonal som testy týchto procesorov série EPYC 9004 na Ubuntu 22.04 s jeho jadro Linux 5.15, ale pre môj pohľad na výkon Linuxu s výhľadom do budúcnosti a s cieľom použiť najnovší upstream softvér sa toto kolo porovnávania vykonalo s Ubuntu 22.10 + Linux 6.0 na všetkých testovaných serverových procesoroch.
Na žiadne prekvapenie je podpora procesorov AMD EPYC 9004 „Genoa“ pre Linux v dobrom stave na uvedenie na trh. Použitie distribúcie s najnovšou verziou linuxového jadra (alebo podnikovej linuxovej distribúcie s jej spätne portovanými/opravenými jadrami) by malo byť pre tieto serverové procesory Zen 4 v dobrom stave. Existujú niektoré funkcie, ktoré sa objavili len nedávno, ako napríklad aktualizované spracovanie záznamu poslednej vetvy, ale všetky kľúčové funkcie sú už zavedené-vrátane monitorovania teploty a spotreby energie. Na strane kompilátora je podpora Zen 4 (znver4) oneskorená. AMD len nedávno zverejnilo svoju počiatočnú opravu Znver4, pričom prenieslo tabuľky nákladov zo Znver3. Táto počiatočná podpora sa nachádza v GCC 13, ktorý má vyjsť v prvých mesiacoch budúceho roka a čaká sa na podporu LLVM/Clang 16.0. Očakáva sa, že AMD čoskoro vydá nové vydanie AOCC pre ich kompilátor AMD Optimizing C/C++ Compiler s optimalizáciami Zen 4.
Počas testovania sa vykonal široký výber testov servera/HPC, pričom sa monitoroval aj výkon procesora spotreba z exponovaných rozhraní RAPL a poskytovanie metrík výkonu na watt na jeden benchmark a ďalšie.
Hneď po spustení niektorých HPC benchmarkov procesory AMD EPYC Genoa ukazujú svoju zdatnosť vo výkone. AMD EPYC 9654 2P mal o 40 % kratší čas spustenia kódu GPAW DFT v porovnaní s EPYC 7773X Milan-X a približoval sa k bodu, že je takmer dvakrát rýchlejší ako procesory EPYC 7763. Pri prepnutí do režimu determinizmu výkonu sa z procesorov EPYC Genoa vyžmýkalo viac výkonu. Nie je to 96 jadier oproti 64 jadrám, čo vedie k veľkému nárastu s Janovom, pretože 64-jadrový výkon EPYC 9554 1P2P bol tiež hviezdny – EPYC 9554 sa vyrovnal výkonu EPYC 7763 2P pre GPAW!
Ale , samozrejme, tieto nové procesory EPYC 9554/9654 spotrebujú viac energie ako ich predchodcovia, ako sa dá očakávať.
Na základe výkonu za dolár fungujú nové procesory EPYC 9554/9654 celkom dobre oproti častiam predchádzajúcej generácie. Samozrejme, je to len cena CPU, ale je potrebné zvážiť aj cenu pamäte DDR5 a cenu platformy, ale nebolo možné pred uvedením na trh prísť s presnými hodnoteniami, aby sme videli, ako sa budú porovnávať ceny základných dosiek Genoa atď. do Milána (X).
Výkon AMD EPYC 9654 a EPYC 9554 bol rovnako hviezdny ako benchmark molekulárnej dynamiky GROMACS. Výkon EPYC 9654 2P bol 1,66-násobok rýchlosti EPYC 7773X 2P a konfigurácia EPYC 9654 1P sa takmer vyrovnala výkonu EPYC 7773X 2P… Došlo k podstatnému zvýšeniu vďaka ďalším jadrám, systémovej pamäti DDR5, 12 pamäťovým kanálom, AVX-512 a ďalšie vylepšenia architektúry Zen 4. A ak beží v režime determinizmu výkonu, ešte vyšší výkon.
Zatiaľ čo spotreba energie EPYC Genoa bola vyššia ako u EPYC Milan(X) a Xeon Ice Lake, na základe výkonu na watt pre GROMACS účinnosť sa nachádza v Janove. Vlajková loď procesorov Intel Xeon Platinum 8380 jednoducho nedokázala konkurovať Genoa a vo väčšine benchmarkov si poradil s Milanom(X), ale aspoň Xeon Sapphire Rapids snáď dorazí budúci štvrťrok.
Výkon na-dolárové metriky založené na cene CPU stavajú Genoa do dobrej kondície.
Testované procesory EPYC Genoa fungovali neuveriteľne s NAMD a priniesli skvelé výsledky generačne z Milána/Milan-X a rozšírili náskok pred súčasnou generáciou Procesory Xeon Ice Lake.
AMD EPYC Genoa si počínal s benchmarkom Graph500 vynikajúco.
Výsledky EPYC 9654/9554 boli ohromujúce aj pre benchmark HPCG. Jednoducho povedané, séria AMD EPYC 9004 prostredníctvom širokej škály benchmarkov neustále poskytovala bezprecedentné zvýšenie výkonu.
Procesory EPYC 9554 a EPYC 9654 vykazovali fenomenálny výkon pri predpovedi počasia pomocou WRF. Pozdvihnutie nielen z EPYC 7773X/7763 na EPYC 9654 bolo ohromujúce, ale dokonca aj 64-jadrový EPYC 9554 bol obrovskou výhodou vďaka AVX-512 a ďalším vylepšeniam oproti predchádzajúcim serverovým procesorom Zen 3.
Zapnuté. procesory EPYC Genoa na základe výkonu za dolár s WRF naďalej žiarili.
S RELION bolo generačné zlepšenie menšie, ale stále významné od Milána (X) po Janov.
AMG bol jedným z mála benchmarkov, kde sa procesory Xeon Platinum 8362/8380 Ice Lake mohli dostať pred vlajkové procesory EPYC Miláno, ale to už nebol prípad Genoa.
Zatiaľ čo EPYC má vyššiu spotrebu energie Procesory Genoa poskytovali skvelú energetickú účinnosť.
Naprieč širokou škálou benchmarkov HPC bol výkon procesora EPYC Genoa jednoducho fenomenálny. Posledných pár týždňov prevádzky EPYC Genoa bolo jedným z najpresvedčivejších výsledkov výkonnostného benchmarku, aké som videl za posledných 18+ rokov, s neuveriteľným generačným vzostupom, pričom stále poskytuje špičkovú energetickú účinnosť a hodnotu.
Naprieč všetkými Široká škála benchmarkov HPC, konfigurácie EPYC 9654 a 9554 ponúkali úžasný výkon v predvolenom režime determinizmu výkonu.
OpenVINO pre softvérový projekt Intel s otvoreným zdrojovým kódom AI dosahoval vynikajúce výsledky na AMD EPYC 9004″Genoa”procesory s AVX-512. Procesory Xeon Platinum 8362/8380 poskytovali lepší výkon v porovnaní s procesormi Milan/Milan-X vďaka AVX-512, ale efektívna implementácia AVX-512 v Janove viedla k oveľa vyššiemu výkonu teraz s OpenVINO.
Zvýšenie s OpenVINO pre Genoa je také dramatické, že hodnota výkonu za dolár ďaleko presahuje existujúce procesory Intel/AMD.
OpenVINO bolo pevnosťou pre Intel Xeon Scalable „Ice Lake“ nad Milánom/Milanom-X ale procesor EPYC 9554 „Genoa“ môže dokonca konkurovať dvom procesorom Xeon Platinum 8380. Výkon Genoa je oriešok.
Naprieč mnohými testovanými modelmi OpenVINO 2022 fungovalo vynikajúco s procesormi EPYC Genoa vďaka podpore AVX-512. Aj keď som sa spočiatku obával implementácie AVX-512 Zen 4 pomocou 256-bitovej dátovej cesty, ukázalo sa, že funguje veľmi dobre a bez vplyvu AVX-512 na výkon a teplotu na starších procesoroch Intel.
Procesory EPYC Genoa tiež fungovali veľmi dobre s knižnicou hlbokej neurónovej siete Intel oneDNN, ktorá dokáže vo veľkej miere využívať AVX-512.
Dokonca aj pri „jednoduchej“ práci, akou je kompilácia kódu naprieč viacerými úlohami na nasýtenie CPU, výkon radu AMD EPYC 9004 stále prinášal značné generačné vylepšenia oproti Milánu.
Výhoda počtu jadier s AMD EPYC tiež pomáha a je oblasťou, v ktorej bude EPYC Genoa stále viesť pred nadchádzajúcimi procesormi Intel Sapphire Rapids.
Nové špičkové procesory Genoa dokážu skompilovať predvolené zostavenie jadra Linuxu x86_64 za menej ako 20 sekúnd!
Alebo zostavenie úplného jadra so všetkými dostupnými modulmi jadra je možné vykonať pod dve minúty.
Výsledok EPYC Janov na základe výkonu za dolár V prípade záujmu o farmu na zostavenie kompilácie kódu/server CI boli porovnateľné so súčasnou cenou v Miláne.
Pre renderovacie farmy založené na procesore AMD EPYC Genoa s až 96 jadrami a vylepšeniami dizajnu oproti Zen 3 sa vyplatili výrazným zlepšením času vykresľovania. Vďaka dobre známej scéne BMW to vlajková loď procesora EPYC 9654 2P dokázala vykresliť za pouhých 8 sekúnd!
AMD EPYC Genoa si s Blenderom 3.3 počínal veľmi dobre s veľkými generačnými vylepšeniami a oveľa lepším výkonom, než aký dokáže dosiahnuť s Xeon Scalable Ice Lake a jeho oveľa nižším počtom jadier.
Režim determinizmu výkonu môže pomôcť s časom vykresľovania Blenderu ešte viac, ak vám nevadí zvýšený výkon/tepelný vplyv.
Na základe výkonu za dolár sú nové CPU Genoa cenovo veľmi porovnateľné s Milánom, prinajmenšom na CPU.
Jadrá Embree ray-tracing od Intelu môžu výrazne profitovať z Janov s AVX-512. EPYC 9654 2P v režime determinizmu výkonu bol dvakrát rýchlejší ako procesor AMD EPYC 7773X 2P.
Tieto testované procesory Genoa majú síce vyššiu spotrebu energie ako Milan, ale na základe výkonu na watt dosahovali oveľa lepšie ako ostatné procesory Intel/AMD.
Genoa fungoval dobre v iných softvérových komponentoch Intel optimalizovaných pre AVX-512, ktoré sú súčasťou ich kolekcie oneAPI.
OSPRay ray-sledovací engine mal nejaké víťazstvá s procesormi Xeon Platinum 8380/8662 nad Milánom/Milanom-X, ale to už nie je prípad Janova. Keďže OSPRay je od Intelu dobre optimalizovaný pre použitie AVX-512 na ich procesoroch Xeon, funguje rovnako dobre s novými serverovými procesormi AMD AVX-512.
V prípade záťaže vykresľovania na báze CPU boli výsledky Genoa úžasné, najmä v prípadoch, ako je jeden EPYC 9654, ktorý dokáže prekonať konfigurácie 2P EPYC 7773X alebo 2P 7763.
V teste Node.js s jedným vláknom bol teraz Janov schopný predbehnúť Ice Lake vďaka Vylepšenia architektúry Zen 4.
Benchmark analýzy simdjson JSON zvyčajne nie je zaujímavý pre výkon veľkého servera, ale teraz má simdjson cestu optimalizovanú pre AVX-512. Procesory série EPYC 9004 boli teraz výrazne pred Ice Lake vďaka podpore Zen 4 AVX-512.
Spotreba energie bola tiež porovnateľná s Ice Lake, pričom procesory neboli úplne nasýtené pre test analýzy JSON.
EPYC 9554 podával najlepší výkon na watt pre tento test analýzy s podporou AVX-512 pre gigabajty údajov JSON.
Testy výkonu v Pythone s jedným vláknom ukázal pekné vylepšenia so Zen 4.
A niekoľko veľmi pekných vylepšení pre Numpy.
Jednovláknový výkon PHP v Genoa bol teraz v stave porovnateľnom len so stavom Ice Lake , ale pre plne naložený webový server je samozrejme väčšia kapacita, ktorú možno nájsť s Genoa a jeho vyšším počtom jadier/vlákna.
V rámci bežnejších pracovných zaťažení, ako je kompresia súborov/údajov, Zen 4 s Genoa prináša niekoľko pekných prírastkových vylepšení oproti Zen 3.
Genoa získal niekoľko hviezdnych víťazstiev s BRL-CAD.
Došlo k významnému generačnému vzostupu y s Genoa pre softvér na digitálne spracovanie digitálneho signálu Liquid-DSP s otvoreným zdrojom.
Skrátka, z približne 200 rôznych testov, ktoré som vykonal, boli procesory AMD EPYC 9654 a EPYC 9554 ohromným úspechom. Priniesli celkovo úžasný generačný nárast, ale najmä v mnohých pracovných zaťaženiach HPC/serverov, ktoré boli schopné využiť AVX-512 a následne rozšírili náskok AMD pred súčasnými procesormi Xeon Scalable „Ice Lake“.
Výsledky OpenFOAM s EPYC Genoa bol fantastický pre open-source výpočtovú dynamiku tekutín (CFD).
OpenRadioss od Altairu tiež vyzerá veľmi dobre v Janove. (Nie všetky CPU tu boli testované, pretože tento nový benchmark bol pridaný neskoro do testovacieho kontrolného cyklu. Ale vzhľadom na záujem o tento nový open-source projekt od Altrair, tu sú referenčné body pre testované CPU.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Vyššie je uvedený pohľad na kombinovanú spotrebu energie pozorovanú pre všetky testované konfigurácie procesorov počas celého trvania vykonaných benchmarkov. Opäť platí, že všetky merania výkonu CPU sú z odhalených rozhraní RAPL v systéme Linux. EPYC 9554 vo svojom predvolenom režime (determinizmus výkonu) mal priemerný príkon 221 wattov so špičkou 355 wattov v porovnaní s EPYC 7763 s priemerom 170 wattov a špičkovým výkonom 286 wattov, ale pri povolení režimu determinizmu výkonu vyskočil na priemer 234 Wattov s vrcholom 404 Wattov. Vlajková loď s 96 jadrami EPYC 9654 mala priemerný príkon 223 wattov a maximálny výkon 363 wattov alebo priemerný výkon 256 wattov v režime determinizmu výkonu a maximálny výkon 415 wattov. V režime EPYC 9654 2P to bol priemer 366 wattov a vrchol 697 wattov alebo v režime determinizmu výkonu priemer 443 wattov a vrchol 833 wattov. Spotreba energie je pri týchto nových procesoroch Socket SP5 vyššia, ale ako ukazujú mnohé z metrík výkonu na watt, pokiaľ ide o energetickú účinnosť, je často pred AMD EPYC 7003 „Milan“ alebo v najhoršom prípade bol výkon zhruba podobný – na watt na diely predchádzajúcej generácie. Zvýšenie výkonu je teda opodstatnené a existujú aj nižšie procesory EPYC 9004 „Genoa“, ak sa nechcú dostať do rozsahu 300 až 400 wattov.
Keď vezmeme geometrický priemer všetkých benchmarkov, ktoré úspešne bežali všetky procesory, takto sa veci otrasú. Dokonca aj jediný EPYC 9554 vychádza pred celkovou konfiguráciou 2P EPYC 7773X… AMD EPYC 4. generácie je skvelé s implementáciou AVX-512, systémovou pamäťou DDR5, dvanástimi pamäťovými kanálmi a ďalšími vylepšeniami architektúry Zen 4. 64-jadrový EPYC 9554 2P bol celkovo o 64 % rýchlejší ako 64-jadrový EPYC 7763 2P, alebo o 67 % pri prevádzke EPYC 9554 2Ps v režime determinizmu výkonu. Medzitým bola vlajková loď EPYC 9654 2P o 74 % rýchlejšia ako EPYC 7763 2P alebo sa zvýšila až o 85 %, keď vlajkové CPU Genoa bežali v režime determinizmu výkonu. AMD EPYC 9654 2P bežal viac ako 2-krát rýchlejšie ako súčasná vlajková loď Intelu, procesory Xeon Scalable 8380 2P „Ice Lake“.
Generačný vzostup z Milána do Janova bol neuveriteľné v širokom rozsahu serverových a HPC benchmarkov, ktoré som vykonal. Teraz môžem len snívať o tom, ako bude Genoa-X vyzerať budúci rok, pretože viem, že je tu ešte väčší potenciál vyžmýkať Zen 4 na strane servera, ako aj budúcoročné procesory Bergamo s až 128 jadrami pre zameranie sa na cloud. výpočtové pracovné zaťaženie.
Ako som už veľa ukázal na strane stolných počítačov série Ryzen 7000, implementácia AVX-512 AMD Zen 4 je pozoruhodne efektívna a to platí ešte viac na strane servera. S ešte relevantnejšími pracovnými záťažami, ktoré môžu využívať AVX-512, a ohromujúcim zvýšením, ako je uvedené v týchto benchmarkoch.
Na základe cien CPU je séria EPYC 9004 konkurencieschopná s existujúcim EPYC 7003″Procesory Milan(X)“ a procesory Xeon Scalable Ice Lake. Prechod do Janova však znamená aj potrebu systémovej pamäte DDR5 ECC, ktorá je drahšia ako DDR4. Zatiaľ som nedostal žiadne rozšírené informácie o cenách pre žiadne maloobchodné základné dosky EPYC Genoa, takže si nie som istý, ako to bude fungovať, ale pravdepodobne so zložitejším Socket SP5 a vyššími požiadavkami na napájanie si vyžiada vyššiu relatívnu cenu v porovnaní s tým, čo máme. vidieť so základnými doskami EPYC SP3. Procesory EPYC Milan budú naďalej dostupné pre tých, ktorí hľadajú servery s nižšou cenou, no so stále veľmi dobrým výkonom.
Na strane podpory Linuxu upstream jadro Linuxu a ďalšie kľúčové komponenty sú v dobrom stave pre podporu pri uvedení na trh so sériou EPYC 9004… Je pravda, že pri dnešnom trhovom podiele serverov Linux je to skôr samozrejmosťou. Stále však existuje priestor pre AMD, aby urobila pokroky v podpore Linuxu/open-source. Napríklad AMD meškalo so svojimi automatickými záplatami IBRS pre linuxové jadro a zverejnilo ich len minulý týždeň. Pre tých, ktorí sa zaujímajú o tieto rozšírené možnosti profilovania, je to tiež len s Linuxom 6.1, kde pristáva vyrovnávacia pamäť procesora AMD s vyrovnávacou pamäťou a hlásenie pamäte s výkonom. S Linuxom 6.1 má premiéru aj funkcia LbrExtV2 Last Branch Record, ktorá je novinkou v Zen 4. Medzitým Linux 6.0 nahradil AMD X2AVIC pre virtuálne stroje KVM. V linuxovom jadre ešte stále nie je potrebné začleniť, ale vo forme opravy je k dispozícii podpora QoS okolo pomalého prideľovania šírky pásma pamäte pomocou pamäte CXL a konfigurácie udalostí sledovania šírky pásma (BMEC). Existuje teda niekoľko nekritických funkcií, ktoré zaznamenali neskoré príchody hlavného linuxového jadra, ale aspoň pokiaľ ide o všetku kľúčovú podporu, je v dobrom stave na spustenie. Samozrejme, keď sa funkcie dostanú do hlavnej línie, je tu aj ďalší čas, kým sa tieto jadrá nájdu v používaní rôznymi distribúciami Linuxu alebo spätne portované na verzie podnikového jadra pre RHEL a SLES. Pozitívne je, že trendová línia upstreamingu Linuxu od AMD pre načasovanie pred uvedením na trh sa zlepšila pre nasledujúce generácie procesorov EPYC/Zen (z veľkej časti preto, že za posledné dva roky najímali oveľa viac linuxových inžinierov).
Stále existuje nešťastný uhol pravdepodobne neskorej podpory ladenia kompilátora pre túto novú generáciu procesorov. Bolo to len v polovici októbra, keď AMD poslalo svoju podporu kompilátora Znver4 pre GCC, ktorý pridal cieľ”-march=znver4″a potom bol koncom októbra zlúčený do GCC 13 Git. Ale s touto počiatočnou podporou prenáša tabuľku nákladov a ladenia zo Znver3-ladenie Znver4 sa očakáva”neskôr”. Dúfajme, že vyladená podpora sa ešte dostane načas pre GCC 13, ktorý by mal mať stabilné vydanie ako GCC 13.1 okolo marca až apríla budúceho roka. Ale potom to nebude až do väčšiny vydaní distribúcie Linuxu H2’2023, ako je Ubuntu 23.10, kde sa GCC 13 používa ako predvolený kompilátor systému. Ak by AMD dostalo podporu Znver4 do GCC v dostatočnom predstihu pred spustením (ako je spoločnosť Intel známa a oddelila veľkú časť svojich možností Sapphire Rapids a AMX pre GCC 12), mohlo by sa už dodávať v Ubuntu 22.04 LTS a ďalších najnovších distribúciách. Existuje aj záplata Znver4 pre GNU Binutils, ktorá je v zozname adresátov a v čase písania tohto článku ešte nebola zlúčená.
Alebo povedané inak, vo výročnom vydaní kompilátora GCC 13, kde je AMD Intel len debutoval s podporou Zen 4 a už vypracoval a zlúčil podporu GCC 13 pre rôzne procesory 2023~2024. GCC 13 už zaradil do radu Grand Ridge a Granite Rapids, Meteor Lake, Sierra Forest a to zahŕňalo povolenie rôznych nových inštrukcií, ktoré prichádzajú s týmito procesormi. Práve tento druh včasnej podpory by som rád videl od AMD (a pred mnohými rokmi boli presní so svojou ranou podporou GCC), aby v čase, keď sa tieto procesory dodávajú, podpora Znver4 by v ideálnom prípade už bola vo vydaní/stabilný kompilátor nájdený najnovšími distribúciami Linuxu. V čase písania neboli na strane LLVM/Clang zverejnené žiadne záplaty Znver4 na upstream kontrolu, kým je kadencia vydávania najmenej šesť mesiacov. Intel naďalej vedie po softvérovej stránke, pokiaľ ide o ich hviezdne načasovanie open-source/Linux vo veľkej väčšine prípadov za posledné roky. Načasovanie aktivácie upstream je opakujúce sa nepríjemné pocity, ktoré mám s AMD každý cyklus spustenia; na strane kompilátora mám jediný logický dôvod, že chcú hrať svoje karty blízko vesty a neodhaliť nové plány rozšírenia ISA pre budúce generácie CPU príliš skoro.
Samozrejme, pokiaľ nekompilujete optimalizované kód pre cieľový procesor servera, táto podpora kompilátora Znver4 pre vás nie je veľkým (alebo žiadnym) problémom. Ale vzhľadom na rastúcu príťažlivosť AMD v oblasti vysokovýkonných výpočtov (HPC) je trochu prekvapujúce, že túto podporu kompilátora nevytlačili skôr. Čoskoro by však malo byť vydané nové vydanie kompilátora AMD Optimizing C/C++ Compiler (AOCC), kde bude Zen 4 v dobrom stave. Hneď ako vyjde nové vydanie AOCC, určite spustím nejaké porovnávacie testy kompilátora v Janove, aby som sa pozrel na vplyv vyladenej podpory kompilátora na tieto serverové procesory Zen 4.
Okrem úžasného výkonu a podpory Linuxu pri spustení je ďalším vzrušujúcim aspektom 4. generácie EPYC zo strany referenčnej platformy Titanite bežiaci s OpenBMC! Bolo vzrušujúce vidieť, ako sa OpenBMC na báze Linuxu používa ako softvérový balík pre referenčný BMC a dúfajme, že sa to prenesie do toho, že OpenBMC bude používať viac serverov série EPYC 9004. Dúfajme tiež, že záujem priemyslu/zákazníkov o firmvér s otvoreným zdrojovým kódom bude pokračovať a AMD bude môcť viac zapojiť Coreboot a ďalšie prvky firmvéru s otvoreným zdrojom.
Ako dobre obstojí Intel Sapphire Rapids v porovnaní so 4. generáciou EPYC bude to zaujímavý súboj. Sapphire Rapids dosiahne iba 60 jadier v porovnaní s 96 jadrami s Genoa, ale výhodou Intelu sú nové rozšírenia Advanced Matrix Extensions (AMX), AVX-512 FP16 a rôzne nové akceleračné bloky. Pokiaľ ide o softvér schopný využiť AMX a akcelerátorovú IP od Intelu, bude to veľmi zaujímavá konkurencia prinajmenšom pre Janov, ale pre tradičnejšie serverové pracovné zaťaženie bude predstavovať pomerne významnú výzvu-musím vám pripomenúť, že geografický priemer na EPYC 9654 2P bol 2x vyšší. Xeon Platinum 8380 2P. Bude tiež zaujímavé sledovať, ako Intel konkuruje rade EPYC 9004 v cenách, najmä so Sapphire Rapids, ktorý predstavuje Intel On Demand/Software Defined Silicon, ktorý ešte viac komplikuje cenovú scénu, najmä ak je spojený s novými blokmi akcelerátora, ktoré sa stávajú prvoradými pre poskytovanie konkurencieschopného výkonu.. Jednou oblasťou, ktorá bude pre Intel so Sapphire Rapids zaujímavá, sú ich HBM2e SKU teraz známe ako Xeon Max, zatiaľ čo aj budúci rok AMD predstaví Genoa-X. Medzi ďalšie výhody procesorov AMD 4th Gen série EPYC patrí podpora CXL 1.1+ a rozšírená podpora SEV-SNP so zvýšenými možnosťami šifrovania pamäte a viac virtuálnych počítačov.