L’EPYC 9654 è il nuovo processore di punta di AMD con 96 core/192 thread, un Clock di base a 2,4 GHz con boost clock a 3,7 GHz e un TDP di 360 Watt. Il TDP configurabile su questa parte di 96 core solitari va da 320 a 400 watt.
L’EPYC 9554 nel frattempo è la parte a 64 core di livello superiore di AMD rispetto all’EPYC 9534. L’EPYC 9554 sfoggia 64 core/128 thread con un clock di base di 3,1 GHz e un boost clock di 3,75 GHz pur avendo un TDP di 360 Watt come l’EPYC 9654. Come l’EPYC 9654, il cTDP può essere regolato da 320 a 400 Watt. L’attuale processore di punta di Milano, l’EPYC 7763, come promemoria è 64 core/128 thread con un clock di base di 2,45 GHz e un boost clock massimo di 3,5 GHz. Oppure sul lato Milan-X c’è l’EPYC 7773X con un clock di base di 2,2 GHz e un boost clock massimo di 3,5 GHz pur avendo i 768 MB di cache L3.
L’AMD EPYC 9374F 32-La parte ad alta frequenza core in arrivo nella sua recensione separata ha un clock di base di 4,05 GHz e un boost di 4,3 GHz pur avendo un TDP di 320 Watt.
L’EPYC 9654 ha un prezzo di lancio di circa $ 11.805, l’EPYC 9554 sarà venduto al dettaglio a circa $ 9.087 USD e l’EPYC 9374F a circa $ 4.850.
Un confronto delle dimensioni di AMD Milan SP3 su AMD Genoa SP5.
AMD ha gentilmente fornito la piattaforma di riferimento Titanite ei processori EPYC 9004 Genoa per questa recensione e benchmarking Linux. Per il lancio di oggi, esamina i processori server testati inclusi:
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Tutti questi processori sono stati recentemente testati/ritestati utilizzando Ubuntu 22.10 con il kernel Linux 6.0 e GCC 12. Maggiori dettagli sullo stack software di seguito.
Per i nuovi processori EPYC Genoa ho testato l’EPYC 9554 e 9654 sia nella modalità di determinismo predefinita”prestazioni”che in il BIOS passa alla modalità determinismo”power”per coloro che sono curiosi dell’impatto complessivo sulle prestazioni del controllo del determinismo dal BIOS. I risultati di Genova del suffisso”-Potenza”si verificano quando si esegue in modalità determinismo di potenza rispetto al determinismo di prestazione predefinito. Tutte le altre impostazioni del BIOS per ciascuno dei processori Intel/AMD testati erano ai rispettivi valori predefiniti. Sia i test 1P che 2P sono stati eseguiti su tutti i processori testati disponibili.
Dato il mio solito”bordo sanguinante”e l’attenzione al futuro, tutti questi benchmark sono stati eseguiti da Ubuntu 22.10 con il suo compilatore stock GCC 12.2. Per un nuovo look del kernel, era in uso Linux 6.0. Questo stesso stack software è stato utilizzato su tutti i server/processori testati. Ciascuna delle configurazioni era in esecuzione con la memoria alla velocità nominale massima e la configurazione del canale di memoria. Tutte le CPU sono state testate utilizzando il regolatore di ridimensionamento della frequenza della CPU”prestazioni”.
Ubuntu 22.04 LTS è in buone condizioni anche per EPYC Genova e ho eseguito test di questi processori della serie EPYC 9004 su Ubuntu 22.04 con il suo kernel Linux 5.15, ma per il mio sguardo alle prestazioni di Linux che guarda al futuro e volendo utilizzare il software upstream più recente, questo round di benchmarking è stato eseguito con Ubuntu 22.10 + Linux 6.0 su tutti i processori server testati.
Nessuna sorpresa, il supporto del processore AMD EPYC 9004″Genoa”per Linux è in buone condizioni per il lancio. L’uso di una distribuzione con una versione recente del kernel Linux (o una distribuzione Linux aziendale con i suoi kernel con backport/patch) dovrebbe essere in buone condizioni per questi processori per server Zen 4. Ci sono alcune funzionalità che sono arrivate solo di recente, come la gestione aggiornata del record Last Branch, ma tutte le funzionalità chiave sono già in atto, incluso il monitoraggio della temperatura e del consumo energetico. Dal lato del compilatore, il supporto per Zen 4 (znver4) è tardivo. AMD ha pubblicato solo di recente la patch di abilitazione iniziale di Znver4, riportando le tabelle dei costi da Znver3. Quel supporto iniziale si troverà in GCC 13 in uscita nei primi mesi del prossimo anno e il supporto LLVM/Clang 16.0 è in sospeso. AMD dovrebbe pubblicare presto una nuova versione AOCC per il suo compilatore AMD Optimizing C/C++ con ottimizzazioni Zen 4.
Durante il benchmarking è stata effettuata un’ampia selezione di benchmark server/HPC monitorando anche la potenza della CPU consumo dalle interfacce RAPL esposte e fornendo metriche di prestazioni per watt per benchmark e altro ancora.
Subito dopo aver attivato alcuni benchmark HPC, i processori AMD EPYC Genoa mostrano la loro abilità in termini di prestazioni. L’AMD EPYC 9654 2P aveva un tempo di esecuzione inferiore del 40% per il codice DFT GPAW rispetto all’EPYC 7773X Milan-X e si stava avvicinando al punto di essere quasi due volte più veloce dei processori EPYC 7763. Quando si è passati alla modalità determinismo di potenza, le prestazioni dei processori EPYC Genoa sono state ridotte. Non sono solo i 96 core contro 64 core che portano al grande miglioramento con Genova poiché anche le prestazioni dell’EPYC 9554 1P2P a 64 core sono state stellari: l’EPYC 9554 ha eguagliato le prestazioni dell’EPYC 7763 2P per GPAW!
Ma , ovviamente, questi nuovi processori EPYC 9554/9654 consumano più energia dei loro predecessori come è prevedibile.
In base alle prestazioni per dollaro, i nuovi processori EPYC 9554/9654 funzionano abbastanza bene contro le parti di generazione precedente. Ovviamente, questo è solo il prezzo della CPU, ma c’è anche il prezzo della memoria DDR5 e il prezzo della piattaforma da considerare, ma non è stato possibile fornire valutazioni accurate prima del lancio per vedere come si confronteranno i prezzi della scheda madre Genova, ecc. a Milano(X).
Le prestazioni di AMD EPYC 9654 ed EPYC 9554 sono state ugualmente stellari con il benchmark di dinamica molecolare GROMACS. Le prestazioni dell’EPYC 9654 2P erano 1,66 volte la velocità dell’EPYC 7773X 2P e la configurazione dell’EPYC 9654 1P quasi eguagliava le prestazioni dell’EPYC 7773X 2P… C’è un sostanziale miglioramento grazie ai core aggiuntivi, alla memoria di sistema DDR5, a 12 canali di memoria, all’AVX-512 e altri miglioramenti dell’architettura Zen 4. E se funziona in modalità determinismo di potenza, prestazioni ancora più elevate.
Sebbene il consumo energetico di EPYC Genova fosse superiore a quello di EPYC Milan(X) e Xeon Ice Lake, in base alle prestazioni per Watt per GROMACS il efficienza si trova con Genova. I processori Xeon Platinum 8380 di punta di Intel erano semplicemente non competitivi con Genoa e hanno avuto abbastanza difficoltà a correre contro Milan(X) nella maggior parte dei benchmark, ma almeno Xeon Sapphire Rapids si spera arrivi nel prossimo trimestre.
Le prestazioni per-le metriche in dollari basate sul prezzo della CPU mettono Genova in buona forma.
I processori EPYC Genoa testati si sono comportati in modo incredibile con NAMD e hanno fornito risultati straordinari a livello generazionale da Milan/Milan-X e hanno ampliato il vantaggio sull’attuale generazione Processori Xeon Ice Lake.
AMD EPYC Genoa si è comportato in modo eccezionale con il benchmark Graph500.
I risultati EPYC 9654/9554 sono stati sbalorditivi anche per il benchmark HPCG. In poche parole, la serie AMD EPYC 9004 attraverso un’ampia varietà di benchmark ha costantemente offerto un aggiornamento delle prestazioni senza precedenti.
I processori EPYC 9554 ed EPYC 9654 hanno mostrato prestazioni fenomenali con le previsioni meteorologiche tramite WRF. Il passaggio non solo dall’EPYC 7773X/7763 all’EPYC 9654 è stato sbalorditivo, ma anche l’EPYC 9554 a 64 core è stato di enorme vantaggio grazie all’AVX-512 e ad altri miglioramenti rispetto ai precedenti processori per server Zen 3.
On in base alle prestazioni per dollaro con WRF, i processori EPYC Genova hanno continuato a brillare.
Con RELION il miglioramento generazionale è stato minore ma comunque significativo da Milano(X) a Genova.
AMG era uno dei pochi benchmark in cui i processori Xeon Platinum 8362/8380 Ice Lake potevano superare i processori di punta EPYC di Milano, ma non era più così con Genova.
Pur avendo un consumo energetico maggiore, l’EPYC I processori Genoa stavano offrendo una grande efficienza energetica.
In un’ampia gamma di benchmark HPC, le prestazioni del processore EPYC Genoa sono state semplicemente fenomenali. Le ultime settimane in cui ho eseguito EPYC Genova sono stati alcuni dei risultati di benchmark prestazionali più convincenti che ho visto negli ultimi 18+ anni con l’incredibile incremento generazionale, offrendo allo stesso tempo efficienza energetica e valore leader.
In tutto un vasto assortimento di benchmark HPC, le configurazioni EPYC 9654 e 9554 offrivano prestazioni eccezionali nella modalità di determinismo delle prestazioni di default.
OpenVINO per il progetto software di intelligenza artificiale open source di Intel si è comportato in modo eccezionale su AMD EPYC 9004″Genova”processori con AVX-512. I processori Xeon Platinum 8362/8380 hanno offerto prestazioni migliori rispetto alle CPU Milan/Milan-X grazie all’AVX-512, ma l’efficiente implementazione dell’AVX-512 di Genova ha portato a prestazioni molto più elevate ora con OpenVINO.
Il miglioramento con OpenVINO per Genova è così drammatico che il valore delle prestazioni per dollaro è di gran lunga superiore a quello delle CPU Intel/AMD esistenti.
OpenVINO era una roccaforte per Intel Xeon Scalable”Ice Lake”su Milano/Milano-X ma il processore EPYC 9554″Genoa”può persino competere con due processori Xeon Platinum 8380. Le prestazioni di Genova sono pazze.
Tra i diversi modelli testati, OpenVINO 2022 si è comportato in modo eccellente con i processori EPYC Genoa grazie al supporto AVX-512. Sebbene inizialmente fossi preoccupato per l’implementazione AVX-512 di Zen 4 che utilizza un percorso dati a 256 bit, ha dimostrato di funzionare molto bene e senza le implicazioni termiche/energetiche dell’AVX-512 sulle precedenti CPU Intel.
I processori EPYC Genoa si sono comportati molto bene anche con la libreria di rete neurale profonda oneDNN di Intel che è in grado di fare ampio uso di AVX-512.
Anche per lavori”semplici”come la compilazione di codice su più lavori per saturare il CPU, le prestazioni della serie AMD EPYC 9004 stavano ancora offrendo notevoli miglioramenti generazionali rispetto a Milano.
Anche il vantaggio del conteggio dei core con AMD EPYC aiuta ed è un’area in cui EPYC Genova continuerà a guidare i prossimi processori Sapphire Rapids di Intel.
I nuovi processori Genoa di fascia alta possono compilare una build del kernel Linux x86_64 predefinita in meno di 20 secondi!
Oppure è possibile creare un kernel completo con tutti i moduli del kernel disponibili in sotto due minuti.
In base alla performance per dollaro, il risultato EPYC Genoa s erano paragonabili all’attuale prezzo di Milano per valore se interessati a una build farm/server CI per la compilazione di codice.
Per le render farm basate su CPU, AMD EPYC Genova con un massimo di 96 core e miglioramenti del design rispetto a Zen 3 stavano dando i loro frutti con significativi miglioramenti del tempo di rendering. Con la famosa scena BMW, il processore di punta EPYC 9654 2P potrebbe renderizzarlo in soli 8 secondi!
AMD EPYC Genova si è comportato molto bene con Blender 3.3 con grandi miglioramenti generazionali e prestazioni molto migliori di quanto possa fare può essere ottenuto con Xeon Scalable Ice Lake e il suo numero di core molto più basso.
La modalità determinismo di potenza può aiutare con il frullatore a rendere i tempi ancora di più, se non ti dispiace la maggiore potenza/impatto termico.
In base alle prestazioni per dollaro, le nuove CPU Genoa sono molto comparabili in termini di prezzo a quelle di Milano, almeno su base CPU.
I kernel di ray-tracing Embree di Intel possono trarre vantaggio in modo significativo da Genova con AVX-512. L’EPYC 9654 2P in modalità determinismo di potenza era il doppio della velocità del processore AMD EPYC 7773X 2P.
Sebbene questi processori Genoa testati abbiano un consumo energetico maggiore rispetto a Milano, in base alle prestazioni per Watt stavano facendo molto meglio delle altre CPU Intel/AMD.
Genoa ha ottenuto buoni risultati con gli altri componenti software Intel ottimizzati per AVX-512 che fanno parte della loro raccolta oneAPI.
L’OSPRay ray-tracing engine ha ottenuto alcune vittorie con i processori Xeon Platinum 8380/8662 su Milan/Milan-X, ma non è più così con Genova. Con OSPRay ben ottimizzato da Intel per l’uso di AVX-512 sulle loro CPU Xeon, si comporta altrettanto bene con i nuovi processori per server AVX-512 di AMD.
Per i carichi di lavoro di rendering basati su CPU, i risultati di Genova sono stati eccezionali soprattutto in casi come un singolo EPYC 9654 in grado di superare una configurazione 2P EPYC 7773X o 2P 7763.
In un benchmark Node.js a thread singolo, Genova è stata ora in grado di superare Ice Lake grazie al Miglioramenti dell’architettura Zen 4.
Il benchmark di analisi JSON di simdjson normalmente non è interessante per le prestazioni di server di grandi dimensioni, ma ora simdjson ha un percorso ottimizzato per AVX-512. I processori della serie EPYC 9004 erano molto più avanti di Ice Lake ora grazie al supporto Zen 4 AVX-512.
Anche il consumo energetico era paragonabile a quello di Ice Lake con le CPU non completamente saturate per il benchmark di analisi JSON.
L’EPYC 9554 offriva le migliori prestazioni per Watt per questo test di analisi compatibile con AVX-512 per gigabyte di dati JSON.
Anche i test delle prestazioni Python a thread singolo ha mostrato i bei progressi con Zen 4.
E alcuni miglioramenti molto interessanti per Numpy.
Le prestazioni PHP a thread singolo di Genova erano ora in uno stato paragonabile solo a quello di Ice Lake , ma per un server web completamente caricato ovviamente c’è più capacità da trovare con Genoa e il suo numero di core/thread più elevato.
Tra i carichi di lavoro più comuni come la compressione di file/dati, Zen 4 con Genoa offre alcuni bei miglioramenti incrementali rispetto a Zen 3.
Genova ha raccolto alcune vittorie stellari con BRL-CAD.
C’è stato un significativo aumento generazionale di cui godere e con Genova per il software di elaborazione del segnale digitale open source Liquid-DSP.
Per farla breve, da circa 200 diversi benchmark che ho eseguito, i processori AMD EPYC 9654 ed EPYC 9554 sono stati un successo strepitoso. Hanno offerto un eccezionale incremento generazionale nel complesso, ma soprattutto nei numerosi carichi di lavoro HPC/server in grado di sfruttare AVX-512 e, a loro volta, hanno ampliato il vantaggio di AMD sugli attuali processori Xeon scalabili”Ice Lake”.
I risultati di OpenFOAM con EPYC Il Genoa è stato fantastico per la fluidodinamica computazionale (CFD) open source.
Anche OpenRadioss di Altair sta andando molto bene su Genova. (Non tutte le CPU sono state testate qui a causa dell’aggiunta del nuovo benchmark in ritardo al ciclo di revisione dei test. Ma dato l’interesse per questo nuovo progetto open source di Altrair, ecco i punti di riferimento per le CPU testate.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Above is uno sguardo al consumo energetico combinato osservato per tutte le configurazioni del processore in prova per l’intera durata dei benchmark effettuati. Ancora una volta, tutte le misurazioni della potenza della CPU provengono dalle interfacce RAPL esposte su Linux. L’EPYC 9554 nella sua modalità predefinita (determinismo delle prestazioni) aveva un assorbimento medio di 221 Watt con un picco di 355 Watt, rispetto all’EPYC 7763 con una media di 170 Watt e un picco di 286 Watt, ma quando si abilita la modalità determinismo è balzato a una media di 234 Watt con un picco di 404 Watt. Nel frattempo, l’ammiraglia EPYC 9654 a 96 core ha un consumo medio di 223 Watt e un picco di 363 Watt, o una media di 256 Watt in modalità determinismo di potenza e un picco di 415 Watt. Nella modalità EPYC 9654 2P era una media di 366 Watt e un picco di 697 Watt o nella modalità determinismo di potenza una media di 443 Watt e un picco di 833 Watt. Il consumo energetico è maggiore con questi nuovi processori Socket SP5 ma, come dimostrato da molte delle metriche delle prestazioni per Watt, quando si tratta di efficienza energetica è spesso superiore all’AMD EPYC 7003″Milano”o nel peggiore dei casi le prestazioni erano più o meno simili. per Watt a quelle parti di generazione precedente. Quindi gli aumenti di potenza sono giustificati e ci sono anche processori EPYC 9004″Genoa”inferiori se non si vuole entrare nella gamma 300~400 Watt.
Quando si prende la media geometrica di tutti i benchmark che sono stati eseguiti con successo tutti i processori, ecco come vanno le cose. Anche un singolo EPYC 9554 esce prima della configurazione 2P EPYC 7773X in generale… AMD 4th Gen EPYC è eccezionale con la sua implementazione AVX-512, memoria di sistema DDR5, dodici canali di memoria e altri miglioramenti dell’architettura Zen 4. L’EPYC 9554 2P a 64 core era il 64% più veloce della configurazione EPYC 7763 2P a 64 core in generale, o il 67% se eseguiva l’EPYC 9554 2Ps in modalità determinismo di potenza. Nel frattempo, l’ammiraglia EPYC 9654 2P era del 74% più veloce dell’EPYC 7763 2P o che saliva all’85% quando le CPU di punta di Genova funzionavano in modalità determinismo di potenza. L’AMD EPYC 9654 2P funzionava a una velocità oltre il doppio dell’attuale ammiraglia di Intel, i processori Xeon Scalable 8380 2P”Ice Lake”.
Il passaggio generazionale da Milano a Genova è stato incredibile attraverso l’ampia gamma di server e benchmark HPC che ho effettuato. Ora sono lasciato a sognare ad occhi aperti su come sarà il Genoa-X l’anno prossimo sapendo che c’è ancora ancora più potenziale per spremere da Zen 4 lato server e dalle CPU Bergamo dell’anno prossimo per un massimo di 128 core focalizzati sul cloud carichi di lavoro di elaborazione.
Come ho già dimostrato molto sul lato desktop della serie Ryzen 7000, l’implementazione dell’AVX-512 di AMD Zen 4 è straordinariamente efficiente e ciò vale ancora di più sul lato server. Con carichi di lavoro ancora più rilevanti qui in grado di utilizzare AVX-512 e alcuni straordinari miglioramenti come mostrato in questi benchmark.
In base al prezzo della CPU, la serie EPYC 9004 è competitiva con l’EPYC 7003 esistente”Processori Milan(X)”e processori Xeon Scalable Ice Lake. Tuttavia, il passaggio a Genova significa anche aver bisogno di memoria di sistema DDR5 ECC che è più costosa di DDR4. Non ho ancora ricevuto alcuna informazione sui prezzi avanzata su nessuna scheda madre al dettaglio EPYC Genova, quindi non sono sicuro di come andrà a finire, ma presumibilmente con il Socket SP5 più complesso e i requisiti di alimentazione più elevati comporterà prezzi relativi più elevati rispetto a quello che abbiamo visto con le schede madri EPYC SP3. I processori EPYC Milan continueranno a essere disponibili per coloro che cercano server a basso prezzo ma con prestazioni ancora molto buone.
Sul lato del supporto Linux, il kernel Linux upstream e altre chiavi i componenti sono in buone condizioni per il supporto al lancio con la serie EPYC 9004… Certo, è piuttosto scontato con la quota di mercato dei server Linux di oggi. Ma c’è ancora spazio per AMD per fare passi da gigante nel loro supporto Linux/open-source. Ad esempio, AMD è arrivata in ritardo con le patch IBRS automatiche per il kernel Linux, pubblicandole solo la scorsa settimana. È anche solo con Linux 6.1 che stanno atterrando la CPU AMD cache-to-cache e il reporting della memoria con perf, per coloro che sono interessati a quelle capacità di profilazione ampliate. Inoltre, solo in anteprima con Linux 6.1 c’è la funzionalità LbrExtV2 Last Branch Record nuova per Zen 4. Nel frattempo Linux 6.0 ha piazzato AMD X2AVIC per macchine virtuali KVM. Ancora da inserire nel kernel Linux, ma disponibile sotto forma di patch, c’è il supporto QoS per l’allocazione della larghezza di banda della memoria lenta con la memoria CXL e la configurazione dell’evento di monitoraggio della larghezza di banda (BMEC). Quindi ci sono alcune funzionalità non critiche che hanno visto arrivi in ritardo per il kernel Linux principale, ma almeno in termini di supporto chiave è in buone condizioni per il lancio. Ovviamente una volta che le funzionalità raggiungono la linea principale, c’è anche il tempo aggiuntivo prima di trovare questi kernel in uso da varie distribuzioni Linux o portati indietro alle versioni del kernel enterprise per artisti del calibro di RHEL e SLES. Una nota positiva, la linea di tendenza verso l’upstream di Linux di AMD per i tempi pre-lancio è migliorata per le generazioni successive di processori EPYC/Zen (in gran parte perché negli ultimi due anni hanno assunto molti più ingegneri Linux).
Per questa nuova generazione di processori c’è ancora lo sfortunato angolo del supporto per l’ottimizzazione del compilatore probabilmente in ritardo. È stato solo a metà ottobre quando AMD ha inviato il supporto del compilatore Znver4 per GCC che ha aggiunto il target”-march=znver4″ed è stato poi unito a GCC 13 Git a fine ottobre. Ma con questo supporto iniziale, sta portando avanti la tabella dei costi/ottimizzazione di Znver3: la messa a punto di Znver4 è prevista”più tardi”. Si spera che il supporto ottimizzato arrivi ancora in tempo per GCC 13, che a sua volta dovrebbe vedere la sua versione stabile come GCC 13.1 intorno a marzo-aprile del prossimo anno. Ma poi non sarà fino alla maggior parte delle versioni della distribuzione Linux H2’2023 come Ubuntu 23.10 in cui GCC 13 viene utilizzato come compilatore di sistema predefinito. Se AMD avesse ottenuto il supporto Znver4 in GCC con largo anticipo rispetto al lancio (come Intel è nota per aver eliminato gran parte delle sue abilitazioni Sapphire Rapids e AMX per GCC 12), potrebbe già essere distribuito in Ubuntu 22.04 LTS e altre distribuzioni recenti. C’è anche una patch Znver4 per GNU Binutils che si trova nella mailing list e al momento della stesura di questo articolo deve ancora essere unita.
O in altre parole, nella versione annuale del compilatore GCC 13 in cui AMD è solo al debutto del supporto Zen 4, Intel ha già elaborato e unito il supporto GCC 13 per vari processori 2023~2024. GCC 13 ha già messo in coda Grand Ridge e Granite Rapids, Meteor Lake, Sierra Forest e ciò includeva l’abilitazione di varie nuove istruzioni fornite con quei processori. È quel tipo di supporto tempestivo che mi piacerebbe vedere da AMD (e molti anni fa erano puntuali con il loro primo supporto GCC) in modo che quando questi processori saranno spediti, il supporto Znver4 sarebbe idealmente già in un rilascio/compilatore stabile trovato dalle ultime distribuzioni Linux. Al momento della scrittura, non sono state pubblicate patch Znver4 per la revisione a monte sul lato LLVM/Clang mentre c’è almeno la cadenza di rilascio di sei mesi. Intel continua a essere leader dal lato software quando si tratta di tempistiche stellari open-source/Linux nella stragrande maggioranza dei casi negli ultimi anni. I tempi di abilitazione a monte sono una seccatura ricorrente che ho con AMD ad ogni ciclo di lancio; dal lato del compilatore l’unico motivo logico che ho è che vogliono giocare le loro carte vicino al giubbotto e non rivelare troppo presto i nuovi piani di estensione ISA per le future generazioni di CPU.
Certo, a meno che tu non stia compilando ottimizzato codice per la destinazione della CPU del server, questo supporto per il compilatore Znver4 non è un grosso problema per te. Ma dato il crescente interesse di AMD nello spazio dell’High Performance Computing (HPC), è un po’sorprendente che non abbiano eliminato prima questo supporto del compilatore. Almeno ci dovrebbe essere presto una nuova versione del compilatore AMD Optimizing C/C++ (AOCC) in cui Zen 4 sarà in buona forma. Una volta rilasciata la nuova versione di AOCC, eseguirò sicuramente alcuni benchmark del compilatore su Genova per esaminare l’impatto del supporto ottimizzato del compilatore su questi processori per server Zen 4.
Oltre alle straordinarie prestazioni e al supporto Linux per il lancio, un altro aspetto interessante dell’EPYC di quarta generazione dal lato della piattaforma di riferimento è Titanite in esecuzione con OpenBMC! È stato emozionante vedere OpenBMC open source basato su Linux utilizzato come stack software per il BMC di riferimento e si spera che questo porterà a vedere OpenBMC utilizzato da più server della serie EPYC 9004. Inoltre, si spera che l’interesse del settore/cliente per il firmware open source continui e che AMD sia in grado di impegnarsi di più su Coreboot e altri elementi del firmware open source.
In che modo Intel Sapphire Rapids si confronta con l’EPYC di quarta generazione sarà una battaglia interessante Sapphire Rapids salirà solo a 60 core rispetto ai 96 core con Genoa, ma a vantaggio di Intel ci sono le nuove Advanced Matrix Extensions (AMX), AVX-512 FP16 e vari nuovi blocchi di accelerazione. Per il software in grado di sfruttare AMX e l’IP dell’acceleratore di Intel sarà una competizione molto interessante almeno per Genova, ma per i carichi di lavoro dei server più tradizionali presenterà una sfida piuttosto significativa-devo ricordarti che la media geografica sull’EPYC 9654 2P era 2 volte quella dello Xeon Platinum 8380 2P. Sarà anche interessante vedere come Intel compete con la serie EPYC 9004 sui prezzi, in particolare con Sapphire Rapids, introducendo Intel On Demand/Software Defined Silicon che complica ulteriormente la scena dei prezzi, soprattutto se legata ai nuovi blocchi dell’acceleratore che diventano fondamentali per fornire prestazioni competitive. Un’area che sarà interessante per Intel con Sapphire Rapids sono le loro SKU HBM2e ora conosciute come Xeon Max, mentre anche il prossimo anno AMD avrà Genova-X da annunciare. Tra gli altri vantaggi dei processori AMD della serie EPYC di quarta generazione vi sono il supporto CXL 1.1+ e il supporto SEV-SNP ampliato con maggiori capacità di crittografia della memoria e più VM.