Intel a une fois de plus présenté ses prochains processeurs Sapphire Rapids HBM Xeon Scalable avec jusqu’à 64 Go de mémoire HBM2e dans divers charges de travail.
Intel promet 3 fois plus de performances avec sa gamme de processeurs Sapphire Rapids HBM”Xeon Scalable”de nouvelle génération
Selon Intel, le Sapphire Rapids-SP sera disponible en deux variantes de package , une configuration standard et une configuration HBM. La variante standard comportera une conception de chiplet composée de quatre matrices XCC qui présenteront une taille de matrice d’environ 400 mm2. Il s’agit de la taille de matrice pour une matrice XCC singulière et il y en aura quatre au total sur la puce Sapphire Rapids-SP Xeon supérieure. Chaque matrice sera interconnectée via EMIB qui a une taille de pas de 55u et un pas de noyau de 100u.
Intel dévoile le pont Rialto : successeur d’IA de nouvelle génération au GPU Ponte Vecchio Xe-HPC avec jusqu’à 160 Xe Cœurs, plus de 20 000 ALU, OAM 2.0, échantillonnage en 2023
Le processeur Intel Xeon, nommé Sapphire Rapids avec mémoire à bande passante élevée (HBM), est un excellent exemple de la façon dont nous tirons parti des technologies de conditionnement avancées et des innovations en silicium pour apporter des améliorations substantielles en termes de performances, de bande passante et d’économie d’énergie pour HPC. Avec jusqu’à 64 gigaoctets de mémoire HBM2e à large bande passante dans le package et des accélérateurs intégrés au processeur, nous sommes en mesure de libérer des charges de travail liées à la bande passante mémoire tout en offrant des améliorations significatives des performances dans les principaux cas d’utilisation HPC.
En comparant les processeurs Intel Xeon Scalable de 3e génération aux futurs processeurs Sapphire Rapids HBM, nous constatons une augmentation des performances de deux à trois fois dans les charges de travail de recherche météorologique, énergétique, de fabrication et physique2. Lors du discours d’ouverture, Ansys CTO Prith Banerjee montre également que Sapphire Rapids HBM offre jusqu’à 2 fois plus de performances sur les charges de travail réelles d’Ansys Fluent et ParSeNet.
Le La puce Sapphire Rapids-SP Xeon standard comportera 10 interconnexions EMIB et l’ensemble du boîtier mesurera à un puissant 4446 mm2. En passant à la variante HBM, nous obtenons un nombre accru d’interconnexions qui se situent à 14 et sont nécessaires pour interconnecter la mémoire HBM2E aux cœurs.
Les quatre packages de mémoire HBM2E comportera des piles 8-Hi, Intel opte donc pour au moins 16 Go de mémoire HBM2E par pile pour un total de 64 Go dans le package Sapphire Rapids-SP. En parlant de l’ensemble, la variante HBM mesurera 5700 mm2 ou 28 % de plus que la variante standard. Par rapport aux numéros EPYC Genoa récemment divulgués, le package HBM2E pour Sapphire Rapids-SP serait 5 % plus grand, tandis que le package standard serait 22 % plus petit.
Intel Sapphire Rapids-SP Xeon (package standard)- 4446mm2 Intel Sapphire Rapids-SP Xeon (boîtier HBM2E)- 5700mm2 AMD EPYC Genoa (boîtier 12 CCD)- 5428mm2
Intel Falcon Shores XPU va pousser le calcul haute performance à l’extrême avec des configurations de CPU x86 et de GPU Xe multi-mosaïques, ciblant plus de 5 fois les performances par watt
Intel déclare également que la liaison EMIB fournit deux fois la bande passante amélioration de la densité et efficacité énergétique 4 fois supérieure par rapport aux conceptions de boîtiers standard. Fait intéressant, Intel appelle la dernière gamme Xeon logiquement monolithique, ce qui signifie qu’ils font référence à l’interconnexion qui offrira la même fonctionnalité qu’un seul die, mais techniquement, il y a quatre chiplets qui seront interconnectés ensemble. Vous pouvez lire tous les détails concernant les processeurs Sapphire Rapids-SP Xeon standard à 56 cœurs et 112 threads ici.
Familles Intel Xeon SP (préliminaire) :
En ce qui concerne les notes de bas de page pour les performances du processeur Intel Sapphire Rapids HBM”Xeon Scalable”, vous pouvez les voir ci-dessous :
CloverLeaf
Test par Intel au 26/04/2022. 1 nœud, 2 processeurs Intel® Xeon® Platinum 8360Y, 72 cœurs, HT activé, Turbo activé, mémoire totale 256 Go (16 x 16 Go DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, noyau 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, boutons de construction:-xCORE-AVX512 –qopt-zmm-usage=high Test par Intel le 19/04/22. 1 nœud, 2 processeurs évolutifs Intel® Xeon® de pré-production nommés Sapphire Rapids Plus HBM, > 40 cœurs, HT ON, Turbo ON, mémoire totale 128 Go (HBM2e à 3 200 MHz), version du BIOS EGSDCRB1.86B.0077.D11.2203281354, révision ucode=0x83000200, CentOS Stream 8, Linux version 5.16, ifort 2021.5, Intel MPI 2021.5.1, boutons de construction :-xCORE-AVX512 –qopt-zmm-usage=high
OpenFOAM
Test par Intel le 26/01/2022. 1 nœud, 2 processeurs Intel® Xeon® Platinum 8380), 80 cœurs, HT activé, Turbo activé, mémoire totale 256 Go (16 x 16 Go 3 200 MT/s, double rang), version du BIOS SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5 , Linux version 4.18., OpenFOAM® v1912, Moto 28M @ 250 itérations ; Notes de construction: Outils: Intel Parallel Studio 2020u4, boutons de construction:-O3-ip-xCORE-AVX512 Test par Intel au 26/01/2022 1 nœud, 2 processeurs évolutifs Intel® Xeon® de pré-production nommés Sapphire Rapids Plus HBM , >40 cœurs, HT Off, Turbo Off, Mémoire totale 128 Go (HBM2e à 3200 MHz), plate-forme de préproduction et BIOS, CentOS 8, Linux version 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 itérations ; Notes de construction : Outils : Intel Parallel Studio 2020u4, boutons de construction :-O3-ip-xCORE-AVX512
WRF
Test par Intel le 05/03/2022. 1 nœud, 2 processeurs Intel® Xeon® 8380, 80 cœurs, HT activé, Turbo activé, mémoire totale 256 Go (16 x 16 Go 3200 MT/s, double rang), version du BIOS SE5C6200.86B.0020.P23.2103261309, révision ucode=0xd000270, Rocky Linux 8.5, Linux version 4.18, WRF v4.2.2 Test par Intel au 05/03/2022. 1 nœud, 2 processeurs évolutifs Intel® Xeon® de pré-production nommés Sapphire Rapids Plus HBM, > 40 cœurs, HT ON, Turbo ON, mémoire totale 128 Go (HBM2e à 3 200 MHz), version du BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux version 5.16, WRF v4.2.2
YASK
Test par Intel en date du 05/9/2022. 1 nœud, 2 processeurs Intel® Xeon® Platinum 8360Y, 72 cœurs, HT activé, Turbo activé, mémoire totale 256 Go (16 x 16 Go DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky linux 8.5, noyau 4.18.0, 0xd000270, Build knobs : make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, Test par Intel le 05/03/22. 1 nœud, 2 processeurs évolutifs Intel® Xeon® de pré-production nommés Sapphire Rapids Plus HBM, > 40 cœurs, HT ON, Turbo ON, mémoire totale 128 Go (HBM2e à 3 200 MHz), version du BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux version 5.16, Build knobs : make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8,
Ansys Fluent
Test par Intel à partir du 2/2022 1 nœud, 2 processeurs Intel ® Xeon ® Platinum 8380, 80 cœurs, HT On, Turbo On, Mémoire totale 256 Go (16×16 Go 3200MT/s, Dual-Rank ), Version du BIOS SE5C6200.86B.0020.P23.2103261309, révision ucode=0xd000270, Rocky Linux 8.5 , Linux version 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m ; Notes de construction: version commerciale utilisant le compilateur Intel 19.3 et le test Intel MPI 2019u par Intel à partir du 2/2022 1 nœud, 2x noms de code du processeur évolutif Intel® Xeon® de pré-production Sapphire Rapids avec HBM, > 40 cœurs, HT Off, Turbo Désactivé, mémoire totale 128 Go (HBM2e à 3200 MHz), plate-forme de préproduction et BIOS, CentOS 8, Linux version 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m ; Notes de version : version commerciale utilisant le compilateur Intel 19.3 et le test Intel MPI 2019u8
Ansys ParSeNet
par Intel en date du 24/05/2022. 1 nœud, 2 processeurs Intel® Xeon® Platinum 8380, 80 cœurs, HT activé, Turbo activé, mémoire totale 256 Go (16 x 16 Go DDR4 3 200 MT/s [3 200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Test par Intel à partir de 18/04/2022. 1 nœud, 2 processeurs évolutifs Intel® Xeon® de pré-production nommés Sapphire Rapids Plus HBM, 112 cœurs, HT On, Turbo On, Mémoire totale 128 Go (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)