EPYC 9654 on AMD:n uusi lippulaivaprosessori, jossa on 96 säiettä, a192 ydintä/. 2,4 GHz:n peruskello, 3,7 GHz:n tehostuskello, ja siinä on 360 watin TDP. Tämän yksittäisen 96-ydinosan konfiguroitavissa oleva TDP on 320–400 wattia.
EPYC 9554 on AMD:n korkeampi 64-ydinosa EPYC 9534:ään verrattuna. EPYC 9554:ssä on 64 ydintä/128 säiettä, 3,1 GHz:n peruskello ja 3,75 GHz:n tehostuskello ja 360 watin TDP, kuten EPYC 9654:ssä. EPYC 9654:n tapaan cTDP:tä voidaan säätää välillä 320 wattia 400 wattiin. Nykyinen Milanon lippulaivaprosessori, EPYC 7763, on muistutuksena 64 ydintä/128 säiettä 2,45 GHz:n peruskellolla ja 3,5 GHz:n maksimitehostuskellolla. Tai Milan-X:n puolella on EPYC 7773X, jossa on 2,2 GHz:n peruskello ja 3,5 GHz:n maksimitehostuskello, samalla kun L3-välimuistia on 768 Mt.
AMD EPYC 9374F 32-ytimen korkeataajuisen osan, joka tulee esille erillisessä katsauksessa, peruskellotaajuus on 4,05 GHz ja tehostus 4,3 GHz samalla kun TDP on 320 wattia.
EPYC 9654:ssä on julkaisuhinta noin 11 805 dollaria, EPYC 9554 vähittäismyyntihinta noin 9 087 dollaria ja EPYC 9374F noin 4 850 dollaria.
AMD Milan SP3:n kokovertailu AMD Genoa SP5:n huipulla.
AMD tarjosi ystävällisesti Titanite-viitealustan ja EPYC 9004 Genoa-prosessorit tätä tarkistusta ja Linux-vertailua varten. Tämän päivän julkaisukatsaukseen testatut palvelinprosessorit sisälsivät:
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-8 Xe6 Platinum
br>-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Kaikki nämä prosessorit on juuri testattu/testattu uudelleen Ubuntu 22.10:llä Linux 6.0-ytimen ja GCC:n kanssa 12. Lisätietoja ohjelmistopinosta alla.
Uusien EPYC Genoa-suorittimien osalta testasin EPYC 9554:n ja 9654:n sekä oletusarvoisessa”performance”-determinismitilassa kuin BIOS siirtyy”teho”-determinismitilaan niille, jotka ovat kiinnostuneita BIOSin determinismin ohjauksen yleisestä suorituskyvystä.”-Power”-liitteen Genoa tulokset ovat, kun ajetaan tehodeterminismitilassa oletusarvoisen suorituskyvyn determinismin yläpuolella. Kaikki muut BIOS-asetukset jokaiselle testatulle Intel/AMD-suorittimelle olivat vastaavissa oletusasetuksissaan. Sekä 1P-että 2P-testaus suoritettiin kaikille saatavilla oleville testatuille prosessoreille.
Tavallinen”verenvuoto”ja tulevaisuuteen katsova keskittymiseni huomioon ottaen kaikki nämä vertailuarvot suoritettiin Ubuntu 22.10:stä ja sen GCC 12.2-varastokääntäjästä. Tuoreen ytimen ilmeen saamiseksi käytössä oli Linux 6.0. Samaa ohjelmistopinoa käytettiin kaikissa testatuissa palvelimissa/prosessoreissa. Kukin kokoonpano toimi muistin kanssa suurimmalla nimellisnopeudella ja muistikanavakonfiguraatiolla. Kaikki suorittimet testattiin”suorituskykyisellä”suorittimen taajuuden skaalausohjaimella.
Ubuntu 22.04 LTS on kuitenkin hyvässä kunnossa myös EPYC Genoalle, ja olen testannut näitä EPYC 9004-sarjan prosessoreja Ubuntu 22.04:lla. sen Linux 5.15-ytimen, mutta näkemääni Linuxin suorituskykyä tulevaisuutta silmällä pitäen ja haluaessani käyttää viimeisintä ylävirran ohjelmistoa, tämä benchmarking suoritettiin Ubuntu 22.10 + Linux 6.0-versiolla kaikissa testatuissa palvelinprosessoreissa.
Ei mikään yllätys, AMD EPYC 9004″Genoa”-prosessorituki Linuxille on hyvässä kunnossa julkaisua varten. Jakelun käyttäminen Linux-ytimen uudemmalla versiolla (tai yritys-Linux-jakelulla, jossa on back-ported/patched-ytimet) pitäisi olla hyvässä kunnossa näille Zen 4-palvelinprosessoreille. Jotkut ominaisuudet saapuivat vasta äskettäin, kuten päivitetty Last Branch Record-käsittely, mutta kaikki keskeiset toiminnot ovat jo käytössä-mukaan lukien lämpötilan ja virrankulutuksen valvonta. Kääntäjän puolella Zen 4 (znver4)-tuki on myöhässä. AMD julkaisi vasta äskettäin ensimmäisen Znver4:n käyttöönottokorjauksensa siirtäen samalla Znver3:n kustannustaulukot. Tämä ensimmäinen tuki löytyy GCC 13:sta, joka julkaistaan ensi vuoden alkukuukausina, ja LLVM/Clang 16.0-tuki on odottamassa. AMD:n odotetaan julkaisevan pian uuden AOCC-julkaisun AMD Optimizing C/C++-kääntäjälleen Zen 4-optimoinnilla.
Vertailun aikana suoritettiin laaja valikoima palvelin/HPC-vertailuja ja samalla tarkkailtiin suorittimen tehoa. kulutuksen paljastuneista RAPL-liitännöistä ja tarjoaa vertailukohtaisia suorituskyky-/wattimittareita ja paljon muuta.
Jos HPC-vertailuarvot käynnistetään heti, AMD EPYC Genoa-prosessorit osoittavat kykynsä suorituskyvyn suhteen. AMD EPYC 9654 2P:n GPAW DFT-koodin ajoaika oli 40 % pienempi kuin EPYC 7773X Milan-X, ja se oli lähes kaksi kertaa nopeampi kuin EPYC 7763-prosessorit. Kun vaihdettiin tehon määrittelytilaan, EPYC Genoa-prosessoreista puristettiin enemmän suorituskykyä. Se ei vain johda 96 ytimeen verrattuna 64 ytimeen, mikä johtaa suureen nousuun Genovan kanssa, sillä 64-ytiminen EPYC 9554 1P2P-suorituskyky oli myös loistava – EPYC 9554 vastasi EPYC 7763 2P:n suorituskykyä GPAW:lle!
Mutta Tietenkin nämä uudet EPYC 9554/9654-prosessorit kuluttavat odotetusti enemmän virtaa kuin edeltäjänsä.
Dollarikohtaisesti laskettuna uudet EPYC 9554/9654-prosessorit toimivat melko hyvin. edellisen sukupolven osia vastaan. Tietenkin tämä on vain suorittimen hinnoittelu, mutta myös DDR5-muistin hinnoittelu ja alustan hinnoittelu on otettava huomioon, mutta siellä ei ollut mahdollista tehdä tarkkoja arvioita ennen julkaisua siitä, kuinka Genovan emolevyn hinnoittelu jne. Milanoon(X).
AMD EPYC 9654:n ja EPYC 9554:n suorituskyky oli yhtä huikea kuin GROMACSin molekyylidynamiikan vertailuarvo. EPYC 9654 2P:n suorituskyky oli 1,66 kertaa nopeampi kuin EPYC 7773X 2P:n nopeus ja EPYC 9654 1P-kokoonpano lähes vastaa EPYC 7773X 2P:n suorituskykyä… Lisäytimien, DDR5-järjestelmämuistin, 12 muistikanavan, AVX:n ansiosta on lisätty huomattavasti.-512 ja muut Zen 4:n arkkitehtoniset parannukset. Ja jos ajetaan tehon määräytymistilassa, jopa parempi suorituskyky.
Vaikka EPYC Genoan virrankulutus oli korkeampi kuin EPYC Milan(X):ssä ja Xeon Ice Lakessa, GROMACSin teho/watti-pohjainen tehokkuus löytyy Genovasta. Intelin lippulaiva Xeon Platinum 8380-prosessorit eivät yksinkertaisesti olleet kilpailevia Genovan kanssa, ja niillä oli riittävän vaikeaa kilpailla Milanoa (X) vastaan useimmissa vertailuissa, mutta ainakin Xeon Sapphire Rapids saapuu toivottavasti ensi vuosineljänneksellä.
Suorituskyky-per. Prosessorin hinnoitteluun perustuvat dollarimittarit tekevät Genovan hyvässä kunnossa.
Testatut EPYC Genoa-prosessorit suoriutuivat uskomattomalla tavalla NAMD:n kanssa ja tuottivat loistavia tuloksia sukupolven aikana Milanosta/Milan-X:stä ja laajensivat etumatkaa nykyiseen sukupolveen Xeon Ice Lake-prosessorit.
AMD EPYC Genoa suoriutui loistavasti Graph500-vertailutestillä.
EPYC 9654/9554-tulokset olivat hämmästyttäviä myös HPCG-vertailussa. Yksinkertaisesti sanottuna AMD EPYC 9004-sarja useiden eri vertailuarvojen avulla tarjosi jatkuvasti ennennäkemättömän suorituskyvyn päivityksen.
EPYC 9554-ja EPYC 9654-prosessorit osoittivat ilmiömäistä suorituskykyä sääennusteen kanssa WRF:n avulla. Nousu EPYC 7773X/7763:sta EPYC 9654:ään oli huikea, mutta jopa 64-ytiminen EPYC 9554 oli valtava etu AVX-512:n ja muiden parannusten ansiosta aiempiin Zen 3-palvelinprosessoreihin verrattuna.
Päällä. WRF:n ansiosta EPYC Genoa-prosessorit jatkoivat loistavaa suorituskykyä dollaria kohden.
RELIONin myötä sukupolvien parannus oli pienempi, mutta silti merkittävä Milanosta (X) Genovaan.
AMG oli yksi harvoista mittareista, jossa Xeon Platinum 8362/8380 Ice Lake-prosessorit pääsivät EPYC Milanin lippulaivaprosessorien edelle, mutta näin ei enää ollut Genovan kohdalla.
Vaikka EPYC:n virrankulutus oli suurempi, se oli suurempi. Genoa-prosessorit tuottivat erinomaisen tehon.
Monissa HPC-vertailussa EPYC Genoa-prosessorin suorituskyky on yksinkertaisesti ollut ilmiömäinen. Viime viikkoina EPYC Genoa on ollut yksi vakuuttavimmista suorituskyvyn vertailutuloksista, joita olen nähnyt yli 18 vuoden aikana uskomattomalla sukupolvien nousulla, samalla kun se tarjoaa johtavan tehokkuuden ja lisäarvon.
Kaikilla alueilla laaja valikoima HPC-testejä, EPYC 9654-ja 9554-kokoonpanot tarjosivat loistavaa suorituskykyä oletussuorituskyvyn determinismitilassa.
OpenVINO Intelin avoimen lähdekoodin tekoälyohjelmistoprojektille suoriutui loistavasti AMD EPYC 9004″Genoa””prosessorit AVX-512:lla. Xeon Platinum 8362/8380-prosessorit tarjosivat paremman suorituskyvyn kuin Milan/Milan-X-suorittimet AVX-512:n ansiosta, mutta Genovan tehokas AVX-512-toteutus johti paljon parempaan suorituskykyyn nyt OpenVINO:n kanssa.
Paras OpenVINO for Genoa on niin dramaattinen, että suorituskyky dollaria kohden on paljon korkeampi kuin olemassa olevilla Intel/AMD-suorittimilla.
OpenVINO oli Intel Xeon Scalable”Ice Laken”tukikohta Milanon/Milan-X:n yläpuolella. mutta EPYC 9554″Genoa”-prosessori voi jopa kilpailla kahden Xeon Platinum 8380-prosessorin kanssa. Genovan suorituskyky on huimaa.
Moneilla testatuilla malleilla OpenVINO 2022 toimi erinomaisesti EPYC Genoa-prosessorien kanssa AVX-512-tuen ansiosta. Vaikka olin aluksi huolissani Zen 4:n AVX-512-toteutuksesta, joka käyttää 256-bittistä datapolkua, se on osoittautunut erittäin toimivaksi ja ilman AVX-512:n teho-/lämpövaikutuksia aikaisemmissa Intel-suorittimissa.
EPYC Genoa-prosessorit suoriutuivat myös erittäin hyvin Intelin oneDNN-syvän hermoverkkokirjaston kanssa, joka pystyy hyödyntämään laajasti AVX-512:ta.
Jopa”yksinkertaisissa”töissä, kuten koodin kääntämisessä useissa töissä. Prosessorit, AMD EPYC 9004-sarjan suorituskyky tuotti edelleen huomattavia sukupolvien parannuksia Milanoon verrattuna.
Myös AMD EPYC:n ydinlukuetu auttaa ja on alue, jolla EPYC Genoa johtaa edelleen Intelin tuleviin Sapphire Rapids-prosessoreihin.
Uudet huippuluokan Genoa-prosessorit voivat kääntää oletusarvoisen Linux x86_64-ytimen koontiversion alle 20 sekunnissa!
Tai koko ytimen rakentaminen kaikilla käytettävissä olevilla ydinmoduuleilla voidaan tehdä alla kaksi minuuttia.
Dollarikohtaisesti laskettuna EPYC Genoa-tulos s olivat verrattavissa nykyiseen Milanon hinnoitteluun, jos olet kiinnostunut koodin käännöksen rakennusfarmista/CI-palvelimesta.
CPU-pohjaisille renderöintifarmille AMD EPYC Genoa jopa 96 ytimellä ja suunnitteluparannuksia Zeniin verrattuna 3 maksoi tulosta merkittävillä renderöintiajan parannuksilla. Tunnetulla BMW-skenellä lippulaiva EPYC 9654 2P-prosessori pystyi toistamaan sen vain kahdeksassa sekunnissa!
AMD EPYC Genoa suoriutui erittäin hyvin Blender 3.3:n kanssa suurilla sukupolvien parannuksilla ja paljon paremmalla suorituskyvyllä. saavutetaan Xeon Scalable Ice Lakella ja sen paljon pienemmällä ydinmäärällä.
Tehon determinismi-tila voi auttaa Blenderin renderöintiaikoissa vieläkin enemmän, jos et välitä lisääntyneestä tehosta/lämpövaikutuksesta.
Dollarikohtaisesti mitattuna uudet Genoan prosessorit ovat hinnaltaan hyvin vertailukelpoisia Milanon kanssa ainakin suorittimen osalta.
Intelin Embree-säteilynseurantaytimet voivat hyötyä merkittävästi Genoa AVX-512:lla. EPYC 9654 2P tehonmäärittelytilassa oli kaksi kertaa nopeampi kuin AMD EPYC 7773X 2P-prosessorilla.
Vaikka näillä testatuilla Genoa-prosessoreilla on korkeampi virrankulutus kuin Milanossa, niiden teho wattia kohden mitattuna paljon parempi kuin muut Intel/AMD-suorittimet.
Genoa suoriutui hyvin muissa AVX-512-optimoiduissa Intel-ohjelmistokomponenteissa, jotka ovat osa heidän oneAPI-kokoelmaansa.
OSPRay-säde-seurantamoottorilla oli joitain voittoja Xeon Platinum 8380/8662-prosessoreilla Milan/Milan-X:n kanssa, mutta se ei ole enää Genovan kohdalla. Intel on optimoinut OSPRayn hyvin AVX-512-käyttöä varten Xeon-suorittimissaan, joten se toimii yhtä hyvin AMD:n uusien AVX-512-palvelinprosessorien kanssa.
CPU-pohjaisissa renderöintityökuormissa Genovan tulokset olivat loistavia etenkin. tapauksissa, kuten yksittäinen EPYC 9654, joka pystyy ylittämään 2P EPYC 7773X-tai 2P 7763-kokoonpanot.
Yksisäikeisessä Node.js-vertailussa Genoa pystyi nyt selviytymään Ice Laken edellä sen ansiosta, että Zen 4:n arkkitehtonisia parannuksia.
Simdjsonin JSON-jäsennysvertailu ei yleensä ole kiinnostava suuren palvelimen suorituskyvyn kannalta, mutta nyt simdjsonilla on AVX-512-optimoitu polku. EPYC 9004-sarjan prosessorit olivat nyt reilusti edellä Ice Lakea Zen 4 AVX-512-tuen ansiosta.
Virrankulutus oli myös verrattavissa Ice Laken virrankulutukseen, sillä prosessorit eivät olleet täysin kyllästyneitä JSON-jäsennysvertailua varten..
EPYC 9554 tuotti parhaan suorituskyvyn wattia kohden tälle AVX-512-yhteensopivalle jäsennystestille gigatavuilla JSON-dataa.
Yksisäikeiset Python-suorituskykytestit myös osoitti hienoja edistysaskeleita Zen 4:n kanssa.
Ja joitain erittäin mukavia parannuksia Numpylle.
Genoan yksisäikeinen PHP-suorituskyky oli nyt verrattavissa vain Ice Laken suorituskykyyn. , mutta täysin ladatulla verkkopalvelimella on tietysti enemmän kapasiteettia Genovan ja sen suuremman ydin-/säikemäärän ansiosta.
Yleisemmissä työkuormissa, kuten tiedostojen/tietojen pakkaamisessa, Zen 4 Genovan kanssa tarjoaa hienoja asteittaisia parannuksia Zen 3:een verrattuna.
Genoa keräsi loistavia voittoja BRL-CAD:lla.
Enjon sukupolvien nousu oli merkittävää. y Genoan kanssa avoimen lähdekoodin digitaaliseen Liquid-DSP-signaalinkäsittelyohjelmistoon.
Lyhyesti sanottuna noin 200:sta tekemästäni eri vertailutestistä AMD EPYC 9654-ja EPYC 9554-prosessorit olivat huima menestys. Ne toivat kaiken kaikkiaan loistavaa sukupolven nousua, mutta erityisesti monissa HPC-/palvelintyökuormissa, jotka pystyivät hyödyntämään AVX-512:ta, ja vuorostaan laajensivat AMD:n johtoasemaa nykyisiin Xeon Scalable”Ice Lake”-prosessoreihin verrattuna.
OpenFOAM-tulos EPYC:llä Genoa oli loistava avoimen lähdekoodin laskennalliseen virtausdynamiikkaan (CFD).
Altairin OpenRadioss näyttää myös erittäin hyvältä Genoassa. (Kaikkia suorittimia ei testattu täällä, koska uusi vertailuarvo lisättiin testaustarkistussykliin. Mutta koska tämä Altrairin uusi avoimen lähdekoodin projekti herätti kiinnostusta, tässä on testattujen suorittimien vertailupisteet.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Above is tarkastella kaikkien testattavien prosessorikokoonpanojen yhdistettyä virrankulutusta suoritettujen vertailuarvojen koko keston aikana. Jälleen kaikki suorittimen tehomittaukset ovat Linuxin näkyvistä RAPL-liitännöistä. EPYC 9554:n oletustilassa (suorituskyvyn determinismi) keskimääräinen virrankulutus oli 221 wattia huipulla 355 wattia verrattuna EPYC 7763:een, jonka keskiarvo on 170 wattia ja huippu 286 wattia, mutta kun tehonmääritystila otettiin käyttöön. hyppäsi 234 wattiin ja huipun ollessa 404 wattia. Sillä välin lippulaivan 96-ytimisen EPYC 9654:n keskimääräinen virrankulutus oli 223 wattia ja huippu 363 wattia tai 256 watin keskiarvo tehodeterminismitilassa ja huippu 415 wattia. EPYC 9654 2P-tilassa, joka oli keskimäärin 366 wattia ja huippu 697 wattia, tai tehodeterminismitilassa keskimäärin 443 wattia ja huippu 833 wattia. Virrankulutus on suurempi näillä uusilla Socket SP5-prosessoreilla, mutta kuten monet suorituskyky per watti-mittaukset osoittavat, tehokkuuden suhteen se on usein AMD EPYC 7003″Milan”edellä tai pahimmassa tapauksessa suorituskyky oli suunnilleen samanlainen. wattia kohden aikaisemman sukupolven osiin. Tehonlisäys on siis perusteltua, ja EPYC 9004″Genoa”-prosessorit ovat myös alhaisemmat, jos ei haluta päästä 300–400 watin alueelle.
Kun otetaan geometrinen keskiarvo kaikista onnistuneesti suoritetuista vertailuarvoista kaikki prosessorit, näin asiat tärisevät. Jopa yksittäinen EPYC 9554 on 2P EPYC 7773X-kokoonpanon edellä… AMD 4. sukupolven EPYC on loistava AVX-512-toteutuksen, DDR5-järjestelmämuistin, 12 muistikanavan ja muiden Zen 4-arkkitehtonisten parannusten ansiosta. 64-ytiminen EPYC 9554 2P oli 64 % nopeampi kuin 64-ytiminen EPYC 7763 2P kokonaisuudessaan tai 67 %, jos EPYC 9554 2P:tä käytettiin tehon määrittelytilassa. Sillä välin lippulaiva EPYC 9654 2P oli 74 % nopeampi kuin EPYC 7763 2P tai se nousi 85 %:iin, kun Genovan lippulaivaprosessorit toimivat tehonmäärittelytilassa. AMD EPYC 9654 2P:n nopeus oli yli kaksinkertainen Intelin nykyiseen lippulaivaan, Xeon Scalable 8380 2P”Ice Lake”-prosessoreihin.
Sukupolvien nousu Milanosta Genovaan oli uskomaton useissa suorittamissani palvelin-ja HPC-vertailuissa. Nyt jään haaveilemaan siitä, miltä Genoa-X näyttää ensi vuonna, kun tiedän, että Zen 4:stä on vielä enemmän potentiaalia puristaa palvelinpuolella sekä ensi vuoden Bergamo-prosessoreilla jopa 128 ytimeen, jotka keskittyvät pilveen. laskennan työmäärät.
Kuten olen jo paljon osoittanut Ryzen 7000-sarjan työpöytäpuolella, AMD Zen 4:n AVX-512-toteutus on huomattavan tehokas, ja se pätee vielä enemmän palvelinpuolelle. AVX-512:n hyödyntäminen mahdollistaa vieläkin merkityksellisemmän työmäärän ja hämmästyttävän nousun, kuten näissä vertailuarvoissa näkyy.
CPU-hinnoittelun perusteella EPYC 9004-sarja on kilpailukykyinen nykyisen EPYC 7003:n kanssa. Milan(X)”-prosessorit ja Xeon Scalable Ice Lake-prosessorit. Siirtyminen Genoaan tarkoittaa kuitenkin myös DDR5 ECC-järjestelmämuistin tarvetta, joka on DDR4:ää kalliimpi. En ole vielä saanut tarkempia hintatietoja mistään EPYC Genoa-vähittäismyyntiemolevyistä, joten en ole varma, miten se tulee toimimaan, mutta oletettavasti monimutkaisemmalla Socket SP5:llä ja korkeammilla tehovaatimuksilla se johtaa korkeampiin suhteellisiin hintoihin verrattuna. nähty EPYC SP3-emolevyillä. EPYC Milan-prosessorit ovat jatkossakin saatavilla niille, jotka etsivät halvempia palvelimia, mutta niiden suorituskyky on edelleen erittäin hyvä.
Linux-tukipuolella ylävirran Linux-ydin ja muut avainasemat komponentit ovat hyvässä kunnossa EPYC 9004-sarjan julkaisutukea varten… Myönnettäköön, että se on melko itsestäänselvyys nykypäivän Linux-palvelinmarkkinoiden osuudessa. Mutta AMD:llä on vielä tilaa edetä Linux/avoimen lähdekoodin tuessa. Esimerkiksi AMD myöhästyi Linux-ytimen automaattisten IBRS-korjausten kanssa julkaisemalla ne vasta viime viikolla. Se on myös vain Linux 6.1:ssä, jossa AMD-suorittimen välimuistista välimuistiin ja muistiraportointi perfillä laskeutuu niille, jotka ovat kiinnostuneita näistä laajennetuista profilointiominaisuuksista. Myös vain Linux 6.1:n kanssa ensiesittelyssä on Zen 4:lle uusi LbrExtV2 Last Branch Record-toiminto. Samaan aikaan Linux 6.0 poisti AMD X2AVIC:n KVM-virtuaalikoneille. Linux-ytimeen ei ole vielä sisällytetty, mutta korjaustiedostona on saatavilla QoS-tuki hitaan muistin kaistanleveyden varaamiseen CXL-muistilla ja Bandwidth Monitoring Event Configuration (BMEC)-määrityksellä. Joten on olemassa muutamia ei-kriittisiä ominaisuuksia, jotka ovat nähneet myöhään saapuneet Linux-ytimen päälinjaan, mutta ainakin kaiken keskeisen tuen kannalta se on hyvässä kunnossa julkaisua varten. Tietenkin, kun ominaisuudet saavuttavat päälinjan, on myös lisäaikaa ennen kuin nämä ytimet löydetään useiden Linux-jakelujen käytössä tai takaisinportoituina yrityksen ydinversioihin, kuten RHEL ja SLES. Positiivisena on se, että AMD:n Linuxin julkaisua edeltävän ajoituksen trendilinja on parantunut seuraavien EPYC/Zen-suorittimien sukupolvien aikana.
Tämän uuden sukupolven kääntäjien viritystuki on edelleen valitettavaa. prosessorit. Vasta lokakuun puolivälissä AMD lähetti Znver4-kääntäjän tuen GCC:lle, joka lisäsi kohteen”-march=znver4″ja yhdistettiin sitten GCC 13 Gitiin lokakuun lopussa. Mutta tällä alustavalla tuella se siirtää Znver3:n kustannus/viritystaulukon-Znver4-viritystä odotetaan”myöhemmin”. Toivottavasti viritetty tuki vielä ehtii GCC 13:lle, joka puolestaan näkee vakaan julkaisunsa GCC 13.1-julkaisuna ensi vuoden maalis-huhtikuussa. Mutta sitten se tapahtuu vasta useimmat H2’2023 Linux-jakelujulkaisut, kuten Ubuntu 23.10, jossa GCC 13:a käytetään oletusjärjestelmän kääntäjänä. Jos AMD olisi saanut Znver4-tukensa GCC:hen hyvissä ajoin ennen julkaisua (kuten Intel on tunnettu Sapphire Rapids-ja AMX-käyttömahdollisuuksistaan ja poistanut suuren osan GCC 12:sta), se voisi olla jo toimitettu Ubuntu 22.04 LTS:ssä ja muissa viimeaikaisissa jakeluissa. Myös GNU Binutilsille on olemassa Znver4-korjaus, joka istuu postituslistalla, ja tätä artikkelia kirjoittaessa sitä ei ole vielä yhdistetty.
Tai toisin sanoen vuosittaisessa GCC 13-kääntäjäjulkaisussa, jossa AMD on Intel on vasta debytoinut Zen 4-tuen, ja se on jo kehittänyt ja yhdistänyt GCC 13-tuen useille 2023–2024 prosessoreille. GCC 13 on jo jonossa Grand Ridge ja Granite Rapids, Meteor Lake, Sierra Forest, ja se sisälsi useiden uusien ohjeiden mahdollistamisen näiden prosessorien mukana. Se on sellainen oikea-aikainen tuki, jonka haluaisin mielelläni AMD:ltä (ja monta vuotta sitten he olivat täsmällisiä varhaisen GCC-tuen kanssa), jotta näiden prosessorien toimitukseen mennessä Znver4-tuki olisi ihanteellisesti jo julkaistu/vakaa kääntäjä, joka löytyy uusimmista Linux-jakeluista. Tätä kirjoitettaessa ei ole julkaistu yhtään Znver4-korjaustiedostoa alkupään tarkastettavaksi LLVM/Clang-puolella, vaikka julkaisuaika on vähintään kuusi kuukautta. Intel on edelleen johtavassa asemassa ohjelmistopuolella, kun on kyse niiden loistavasta avoimen lähdekoodin/Linux-ajoituksen suhteen, useimmissa tapauksissa viime vuosien aikana. Ylävirran käyttöönoton ajoitus on toistuva pettymys, joka minulla on AMD:n kanssa jokaisella käynnistysjaksolla; kääntäjän puolella ainoa looginen syy minulla on se, että he haluavat pelata korttinsa lähellä liiviä eikä paljastaa uusia ISA-laajennussuunnitelmia tuleville prosessorisukupolville liian aikaisin.
Myös, ellet käännä optimoitua koodi palvelimen CPU-kohdetta varten, tämä Znver4-kääntäjätuki ei ole suuri (tai mikään) ongelma sinulle. Mutta kun otetaan huomioon AMD:n kasvava vetovoima korkean suorituskyvyn tietojenkäsittelyssä (HPC), on hieman yllättävää, etteivät he ole ajaneet tätä kääntäjän tukea aikaisemmin. Pian ainakin pitäisi olla uusi AMD Optimizing C/C++ Compiler (AOCC)-julkaisu, jossa Zen 4 on hyvässä kunnossa. Kun uusi AOCC-julkaisu on julkaistu, aion varmasti käyttää Genovan kääntäjätestejä, jotta voin tarkastella viritetyn kääntäjän tuen vaikutusta näihin Zen 4-palvelinprosessoreihin.
Loistavan suorituskyvyn ja Linux-tuen lisäksi 4. sukupolven EPYC:n toinen jännittävä puoli vertailualustan puolelta on Titanite, joka toimii OpenBMC:n kanssa! Oli jännittävää nähdä Linux-pohjaista, avoimen lähdekoodin OpenBMC:tä käytettävän ohjelmistopinona referenssi-BMC:lle, ja toivottavasti tämä jatkuu, kun OpenBMC:tä käytetään useammissa EPYC 9004-sarjan palvelimissa. Toivottavasti myös alan/asiakkaiden kiinnostus avoimen lähdekoodin laiteohjelmistoon jatkuu ja AMD:llä on mahdollisuus osallistua enemmän Corebootin ja muiden avoimen lähdekoodin laiteohjelmistoelementtien parissa.
Kuinka hyvin Intel Sapphire Rapids pärjää 4. sukupolven EPYC:tä vastaan. tulee olemaan mielenkiintoinen taistelu. Sapphire Rapids kasvaa vain 60 ytimeen verrattuna Genoan 96 ytimeen, mutta Intelin etuna on uudet Advanced Matrix Extensions (AMX), AVX-512 FP16 ja useat uudet kiihdytinlohkot. Ohjelmisto, joka pystyy hyödyntämään AMX:n ja Intelin kiihdytin IP:tä, tulee olemaan erittäin mielenkiintoinen kilpailu ainakin Genoalle, mutta perinteisemmille palvelintyökuormille melko merkittävä haaste – täytyy muistuttaa, että EPYC 9654 2P:n maantieteellinen keskiarvo oli kaksinkertainen. Xeon Platinum 8380 2P:stä. On myös mielenkiintoista nähdä, kuinka Intel kilpailee EPYC 9004-sarjan kanssa hinnoittelussa, erityisesti Sapphire Rapidsin kanssa, joka esittelee Intel On Demand/Software Defined Siliconin, joka vaikeuttaa hinnoittelua entisestään, varsinkin jos se on sidottu uusiin kiihdytinlohkoihin, joista tulee ensiarvoisen tärkeitä kilpailukykyisen suorituskyvyn saavuttamiseksi.. AMD 4. sukupolven EPYC-sarjan prosessorien muita etuja ovat CXL 1.1+-tuki ja laajennettu SEV-SNP-tuki, jossa on parannetut muistin salausominaisuudet ja enemmän VM-laitteita.