Intel ha dimostrato ancora una volta le prossime CPU scalabili Sapphire Rapids HBM Xeon con fino a 64 GB di memoria HBM2e in vari carichi di lavoro.
Intel promette un aumento delle prestazioni 3 volte superiore con la sua gamma di CPU Sapphire Rapids HBM di nuova generazione’Xeon Scalable’
Secondo Intel, Sapphire Rapids-SP sarà disponibile in due varianti di pacchetto , una configurazione standard e una HBM. La variante standard presenterà un design chiplet composto da quattro die XCC che presenteranno una dimensione die di circa 400 mm2. Questa è la dimensione del dado per un singolo dado XCC e ce ne saranno quattro in totale sul chip Sapphire Rapids-SP Xeon top. Ciascun die sarà interconnesso tramite EMIB, che ha un pitch size di 55u e un core pitch di 100u.
Le specifiche del supercomputer Kestrel di NREL rivelano un mix di CPU Intel Sapphire Rapids Xeon e AMD Genoa Dual-Socket, 528 NVIDIA H100 GPU
Il processore Intel Xeon con nome in codice Sapphire Rapids con memoria HBM (High Bandwidth Memory) è un ottimo esempio di come stiamo sfruttando tecnologie di packaging avanzate e innovazioni al silicio per offrire prestazioni, larghezza di banda e miglioramenti del risparmio energetico per HPC. Con un massimo di 64 gigabyte di memoria HBM2e a larghezza di banda elevata nel pacchetto e acceleratori integrati nella CPU, siamo in grado di liberare carichi di lavoro legati alla larghezza di banda della memoria offrendo al contempo miglioramenti significativi delle prestazioni nei casi d’uso chiave dell’HPC.
Confrontando i processori scalabili Intel Xeon di terza generazione con i prossimi processori Sapphire Rapids HBM, osserviamo un aumento delle prestazioni da due a tre volte nei carichi di lavoro di ricerca meteorologica, energia, produzione e fisica2. Al keynote, il CTO di Ansys Prith Banerjee ha anche mostrato che Sapphire Rapids HBM offre un aumento delle prestazioni fino a 2 volte superiore sui carichi di lavoro del mondo reale da Ansys Fluent e ParSeNet.
Il Il chip standard Sapphire Rapids-SP Xeon sarà caratterizzato da 10 interconnessioni EMIB e l’intero pacchetto misurerà un potente 4446 mm2. Passando alla variante HBM, stiamo ottenendo un numero maggiore di interconnessioni che si trovano a 14 e sono necessarie per interconnettere la memoria HBM2E ai core.
I quattro pacchetti di memoria HBM2E sarà caratterizzato da stack 8-Hi, quindi Intel utilizzerà almeno 16 GB di memoria HBM2E per stack per un totale di 64 GB nel pacchetto Sapphire Rapids-SP. Parlando del pacchetto, la variante HBM misurerà un folle 5700 mm2 o il 28% in più rispetto alla variante standard. Rispetto ai numeri EPYC Genova trapelati di recente, il pacchetto HBM2E per Sapphire Rapids-SP finirebbe per essere più grande del 5% mentre il pacchetto standard sarà più piccolo del 22%.
Intel Sapphire Rapids-SP Xeon (pacchetto standard)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (pacchetto HBM2E)- 5700 mm2 AMD EPYC Genova (pacchetto 12 CCD)- 5428 mm2
Le CPU AMD Ryzen 7000 potrebbero avere un vantaggio rispetto alle capacità di memoria DDR5 Raptor Lake di Intel poiché le velocità”native”di 5200 Mbps sono elencate per la 13a generazione
Intel afferma inoltre che il collegamento EMIB fornisce il doppio del miglioramento della densità della larghezza di banda e 4 volte migliore efficienza energetica rispetto ai modelli di pacchetto standard. È interessante notare che Intel chiama l’ultima linea Xeon Logicamente monolitica, il che significa che si riferiscono all’interconnessione che offrirà le stesse funzionalità di un single-die ma tecnicamente ci sono quattro chiplet che saranno interconnessi insieme. Puoi leggere i dettagli completi relativi alle CPU Sapphire Rapids-SP Xeon standard a 56 core e 112 thread qui.
Intel Xeon SP Families (preliminare):
Per quanto riguarda le note a piè di pagina sulle prestazioni della CPU Intel Sapphire Rapids HBM’Xeon Scalable’, puoi vederle di seguito:
CloverLeaf
Test di Intel al 26/04/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8360Y, 72 core, HT On, Turbo On, Memoria totale 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, manopole build:-xCORE-AVX512 –qopt-zmm-usage=high Test di Intel a partire dal 19/04/22. 1 nodo, 2 processori scalabili Intel® Xeon® di pre-produzione con nome in codice Sapphire Rapids Plus HBM, >40 core, HT ON, Turbo ON, memoria totale 128 GB (HBM2e a 3200 MHz), versione BIOS EGSDCRB1.86B.0077.D11.2203281354, revisione ucode=0x83000200, CentOS Stream 8, Linux versione 5.16, ifort 2021.5, Intel MPI 2021.5.1, manopole build:-xCORE-AVX512 –qopt-zmm-usage=high
OpenFOAM
Test di Intel al 26/01/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8380), 80 core, HT On, Turbo On, Memoria totale 256 GB (16x16GB 3200MT/s, Dual-Rank), Versione BIOS SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5, Linux versione 4.18., OpenFOAM® v1912, Moto 28M @ 250 iterazioni; Note di costruzione: Strumenti: Intel Parallel Studio 2020u4, Manopole di costruzione:-O3-ip-xCORE-AVX512 Test di Intel al 26/01/2022 Processore scalabile Intel® Xeon® a 1 nodo, 2x pre-produzione nome in codice Sapphire Rapids Plus HBM , >40 core, HT Off, Turbo Off, Memoria totale 128 GB (HBM2e a 3200 MHz), piattaforma di preproduzione e BIOS, CentOS 8, Linux versione 5.12, OpenFOAM® v1912, Moto 28M @ 250 iterazioni; Note di build: Strumenti: Intel Parallel Studio 2020u4, Manopole di build:-O3-ip-xCORE-AVX512
WRF
Test di Intel a partire dal 05/03/2022. 1 nodo, 2x CPU Intel® Xeon® 8380, 80 core, HT On, Turbo On, memoria totale 256 GB (16x16GB 3200MT/s, Dual-Rank), versione BIOS SE5C6200.86B.0020.P23.2103261309, revisione ucode=0xd000270, Rocky Linux 8.5, Linux versione 4.18, WRF v4.2.2 Test di Intel a partire dal 05/03/2022. 1 nodo, 2 processori scalabili Intel® Xeon® di pre-produzione con nome in codice Sapphire Rapids Plus HBM, >40 core, HT ON, Turbo ON, memoria totale 128 GB (HBM2e a 3200 MHz), versione BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versione 5.16, WRF v4.2.2
YASK
Test di Intel a partire dal 05/9/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8360Y, 72 core, HT On, Turbo On, Memoria totale 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky linux 8.5, kernel 4.18.0, 0xd000270, Costruisci manopole: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd raggio=8, Test di Intel a partire dal 05/03/22. 1 nodo, 2 processori scalabili Intel® Xeon® di pre-produzione con nome in codice Sapphire Rapids Plus HBM, >40 core, HT ON, Turbo ON, memoria totale 128 GB (HBM2e a 3200 MHz), versione BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versione 5.16, Build manopole: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd raggio=8,
Ansys Fluent
Test di Intel a partire dal 2/2022 1 nodo, 2x CPU Intel ® Xeon ® Platinum 8380, 80 core, HT On, Turbo On, Memoria totale 256 GB (16x16GB 3200MT/s, Dual-Rank ), BIOS versione SE5C6200.86B.0020.P23.2103261309, revisione ucode=0xd000270, Rocky Linux 8.5 , Linux versione 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Note sulla build: versione commerciale che utilizza il compilatore Intel 19.3 e il test Intel MPI 2019u di Intel a partire dal 2/2022 1 nodo, 2x nomi in codice del processore scalabile Intel® Xeon® di pre-produzione Sapphire Rapids con HBM, >40 core, HT Off, Turbo Spento, memoria totale 128 GB (HBM2e a 3200 MHz), piattaforma di preproduzione e BIOS, CentOS 8, Linux versione 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Note sulla build: versione commerciale che utilizza il compilatore Intel 19.3 e Intel MPI 2019u8
Ansys ParSeNet
Test di Intel a partire dal 24/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380, 80 core, HT On, Turbo On, Memoria totale 256 GB (16×16 GB DDR4 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Test di Intel a partire da 18/04/2022. 1 nodo, 2 processori scalabili Intel® Xeon® di pre-produzione con nome in codice Sapphire Rapids Plus HBM, 112 core, HT On, Turbo On, memoria totale 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Build 20210904), oneDNN (v2.5.0)