Intel hat erneut seine kommenden Sapphire Rapids HBM Xeon Scalable-CPUs mit bis zu 64 GB HBM2e-Speicher in verschiedenen Ausführungen vorgestellt Workloads.
Intel verspricht 3-fache Leistungssteigerung mit seiner Sapphire Rapids HBM „Xeon Scalable“-CPU-Reihe der nächsten Generation
Laut Intel wird der Sapphire Rapids-SP in zwei Paketvarianten erhältlich sein , eine Standard-und eine HBM-Konfiguration. Die Standardvariante wird ein Chiplet-Design aufweisen, das aus vier XCC-Dies besteht, die eine Die-Größe von etwa 400 mm2 haben werden. Dies ist die Die-Größe für einen einzelnen XCC-Die und es werden insgesamt vier auf dem oberen Sapphire Rapids-SP Xeon-Chip vorhanden sein. Jeder Chip wird über EMIB verbunden, das eine Rastergröße von 55 u und einen Kernabstand von 100 u hat.
Kestrel Supercomputer Specs von NREL enthüllen eine Mischung aus Intel Sapphire Rapids Xeon und AMD Genoa Dual-Socket-CPUs, 528 NVIDIA H100 GPUs
Der Intel Xeon-Prozessor mit dem Codenamen Sapphire Rapids mit High Bandwidth Memory (HBM) ist ein großartiges Beispiel dafür, wie wir fortschrittliche Verpackungstechnologien und Siliziuminnovationen nutzen, um erhebliche Leistung, Bandbreite und mehr zu erreichen Energiesparverbesserungen für HPC. Mit bis zu 64 Gigabyte HBM2e-Speicher mit hoher Bandbreite im Paket und in die CPU integrierten Beschleunigern sind wir in der Lage, arbeitsspeicherbandbreitengebundene Workloads zu entfesseln und gleichzeitig erhebliche Leistungsverbesserungen in wichtigen HPC-Anwendungsfällen zu erzielen.
Beim Vergleich von Intel Xeon Scalable-Prozessoren der 3. Generation mit den kommenden Sapphire Rapids HBM-Prozessoren sehen wir zwei-bis dreifache Leistungssteigerungen bei Wetterforschungs-, Energie-, Fertigungs-und Physik-Workloads2. Auf der Keynote zeigt Prith Banerjee, CTO von Ansys, auch, dass Sapphire Rapids HBM eine bis zu 2-fache Leistungssteigerung bei realen Workloads von Ansys Fluent und ParSeNet bietet.
Die Der standardmäßige Sapphire Rapids-SP Xeon-Chip verfügt über 10 EMIB-Verbindungen und das gesamte Paket misst mächtige 4446 mm2. Beim Übergang zur HBM-Variante erhalten wir eine erhöhte Anzahl von Verbindungen, die bei 14 liegen und benötigt werden, um den HBM2E-Speicher mit den Kernen zu verbinden.
Die vier HBM2E-Speicherpakete wird über 8-Hi-Stacks verfügen, so dass Intel mindestens 16 GB HBM2E-Speicher pro Stack für insgesamt 64 GB im gesamten Sapphire Rapids-SP-Paket vorsieht. Apropos Paket: Die HBM-Variante misst wahnsinnige 5700 mm2 oder ist 28 % größer als die Standardvariante. Im Vergleich zu den kürzlich durchgesickerten EPYC-Genoa-Zahlen würde das HBM2E-Paket für Sapphire Rapids-SP 5 % größer ausfallen, während das Standardpaket 22 % kleiner ausfällt.
Intel Sapphire Rapids-SP Xeon (Standardpaket)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (HBM2E-Paket)- 5700 mm2 AMD EPYC Genua (12 CCD-Paket)- 5428 mm2
AMD Ryzen 7000-CPUs haben möglicherweise einen Vorteil gegenüber Intels Raptor Lake DDR5-Speicherkapazitäten, da 5200 Mbit/s „native“ Geschwindigkeiten für die 13 mal bessere Energieeffizienz im Vergleich zu Standardgehäusedesigns. Interessanterweise nennt Intel die neueste Xeon-Produktreihe logisch monolithisch, was bedeutet, dass sie sich auf die Verbindung beziehen, die die gleiche Funktionalität wie ein Einzelchip bietet, aber technisch gesehen gibt es vier Chiplets, die miteinander verbunden werden. Sie können die vollständigen Details zu den standardmäßigen Sapphire Rapids-SP Xeon-CPUs mit 56 Kernen und 112 Threads hier lesen.
Intel Xeon SP-Familien (vorläufig):
Was die Fußnoten für die Intel Sapphire Rapids HBM „Xeon Scalable“-CPU-Leistung betrifft, können Sie sie unten sehen:
CloverLeaf
Test durch Intel am 26.04.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8360Y CPU, 72 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, Build-Knöpfe:-xCORE-AVX512 –qopt-zmm-usage=high Test von Intel am 19.04.22. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, ucode-Revision=0x83000200, CentOS Stream 8, Linux-Version 5.16, ifort 2021.5, Intel MPI 2021.5.1, Build-Regler:-xCORE-AVX512 –qopt-zmm-usage=high
OpenFOAM
Test von Intel am 26.01.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8380 CPU), 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank), BIOS-Version SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5, Linux-Version 4.18., OpenFOAM® v1912, Motorbike 28M @ 250 Iterationen; Build-Hinweise: Tools: Intel Parallel Studio 2020u4, Build-Regler:-O3-ip-xCORE-AVX512 Test von Intel am 26.01.2022 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor mit dem Codenamen Sapphire Rapids Plus HBM , >40 Kerne, HT aus, Turbo aus, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), Vorproduktionsplattform und BIOS, CentOS 8, Linux Version 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 Iterationen; Build-Hinweise: Tools: Intel Parallel Studio 2020u4, Build-Regler:-O3-ip-xCORE-AVX512
WRF
Test von Intel am 03.05.2022. 1 Knoten, 2 x Intel® Xeon® 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank), BIOS-Version SE5C6200.86B.0020.P23.2103261309, ucode-Revision=0xd000270, Rocky Linux 8.5, Linux Version 4.18, WRF v4.2.2 Test von Intel am 03.05.2022. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux Version 5.16, WRF v4.2.2
YASK
Test von Intel am 09.05.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8360Y CPU, 72 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky Linux 8.5, Kernel 4.18.0, 0xd000270, Build-Regler: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, Test von Intel am 03.05.22. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, Ucode-Revision=0x83000200, CentOS Stream 8, Linux-Version 5.16, Build-Regler: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8,
Ansys Fluent
Test von Intel ab 2/2022 1-Knoten, 2x Intel® Xeon® Platinum 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank ), BIOS-Version SE5C6200.86B.0020.P23.2103261309, Ucode-Revision=0xd000270, Rocky Linux 8.5, Linux-Version 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-Hinweise: Kommerzielle Veröffentlichung mit Intel 19.3-Compiler und Intel MPI 2019u Test von Intel ab 2/2022 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codenamen Sapphire Rapids mit HBM, >40 Kerne, HT aus, Turbo Aus, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), Vorproduktionsplattform und BIOS, CentOS 8, Linux-Version 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-Hinweise: Kommerzielle Version mit Intel 19.3-Compiler und Intel MPI 2019u8
Ansys ParSeNet
Test von Intel am 24.05.2022. 1 Knoten, 2 x Intel® Xeon® Platinum 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Test von Intel ab 18.04.2022. 1-Knoten, 2x skalierbarer Intel® Xeon® Vorproduktionsprozessor mit dem Codenamen Sapphire Rapids Plus HBM, 112 Kerne, HT ein, Turbo ein, Gesamtspeicher 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Produkt-Build 20210904), oneDNN (v2.5.0)