Intel hat erneut seine kommenden Sapphire Rapids HBM Xeon Scalable-CPUs mit bis zu 64 GB HBM2e-Speicher in verschiedenen Ausführungen vorgestellt Workloads.

Intel verspricht 3-fache Leistungssteigerung mit seiner Sapphire Rapids HBM „Xeon Scalable“-CPU-Reihe der nächsten Generation

Laut Intel wird der Sapphire Rapids-SP in zwei Paketvarianten erhältlich sein , eine Standard-und eine HBM-Konfiguration. Die Standardvariante wird ein Chiplet-Design aufweisen, das aus vier XCC-Dies besteht, die eine Die-Größe von etwa 400 mm2 haben werden. Dies ist die Die-Größe für einen einzelnen XCC-Die und es werden insgesamt vier auf dem oberen Sapphire Rapids-SP Xeon-Chip vorhanden sein. Jeder Chip wird über EMIB verbunden, das eine Rastergröße von 55 u und einen Kernabstand von 100 u hat.

Kestrel Supercomputer Specs von NREL enthüllen eine Mischung aus Intel Sapphire Rapids Xeon und AMD Genoa Dual-Socket-CPUs, 528 NVIDIA H100 GPUs

Der Intel Xeon-Prozessor mit dem Codenamen Sapphire Rapids mit High Bandwidth Memory (HBM) ist ein großartiges Beispiel dafür, wie wir fortschrittliche Verpackungstechnologien und Siliziuminnovationen nutzen, um erhebliche Leistung, Bandbreite und mehr zu erreichen Energiesparverbesserungen für HPC. Mit bis zu 64 Gigabyte HBM2e-Speicher mit hoher Bandbreite im Paket und in die CPU integrierten Beschleunigern sind wir in der Lage, arbeitsspeicherbandbreitengebundene Workloads zu entfesseln und gleichzeitig erhebliche Leistungsverbesserungen in wichtigen HPC-Anwendungsfällen zu erzielen.

Beim Vergleich von Intel Xeon Scalable-Prozessoren der 3. Generation mit den kommenden Sapphire Rapids HBM-Prozessoren sehen wir zwei-bis dreifache Leistungssteigerungen bei Wetterforschungs-, Energie-, Fertigungs-und Physik-Workloads2. Auf der Keynote zeigt Prith Banerjee, CTO von Ansys, auch, dass Sapphire Rapids HBM eine bis zu 2-fache Leistungssteigerung bei realen Workloads von Ansys Fluent und ParSeNet bietet.

Die Der standardmäßige Sapphire Rapids-SP Xeon-Chip verfügt über 10 EMIB-Verbindungen und das gesamte Paket misst mächtige 4446 mm2. Beim Übergang zur HBM-Variante erhalten wir eine erhöhte Anzahl von Verbindungen, die bei 14 liegen und benötigt werden, um den HBM2E-Speicher mit den Kernen zu verbinden.

Die vier HBM2E-Speicherpakete wird über 8-Hi-Stacks verfügen, so dass Intel mindestens 16 GB HBM2E-Speicher pro Stack für insgesamt 64 GB im gesamten Sapphire Rapids-SP-Paket vorsieht. Apropos Paket: Die HBM-Variante misst wahnsinnige 5700 mm2 oder ist 28 % größer als die Standardvariante. Im Vergleich zu den kürzlich durchgesickerten EPYC-Genoa-Zahlen würde das HBM2E-Paket für Sapphire Rapids-SP 5 % größer ausfallen, während das Standardpaket 22 % kleiner ausfällt.

Intel Sapphire Rapids-SP Xeon (Standardpaket)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (HBM2E-Paket)- 5700 mm2 AMD EPYC Genua (12 CCD-Paket)- 5428 mm2

AMD Ryzen 7000-CPUs haben möglicherweise einen Vorteil gegenüber Intels Raptor Lake DDR5-Speicherkapazitäten, da 5200 Mbit/s „native“ Geschwindigkeiten für die 13 mal bessere Energieeffizienz im Vergleich zu Standardgehäusedesigns. Interessanterweise nennt Intel die neueste Xeon-Produktreihe logisch monolithisch, was bedeutet, dass sie sich auf die Verbindung beziehen, die die gleiche Funktionalität wie ein Einzelchip bietet, aber technisch gesehen gibt es vier Chiplets, die miteinander verbunden werden. Sie können die vollständigen Details zu den standardmäßigen Sapphire Rapids-SP Xeon-CPUs mit 56 Kernen und 112 Threads hier lesen.

Intel Xeon SP-Familien (vorläufig):

Familien-BrandingSkylake-SPCascade Lake-SP/APCooper Lake-SPIce Lake-SPSapphire RapidsEmerald RapidsGranite RapidsDiamond Rapids Process Node14nm+14nm++14nm++10nm+Intel 7Intel 7Intel 3Intel 3? PlattformnameIntel PurleyIntel PurleyIntel Cedar IslandIntel WhitleyIntel Eagle StreamIntel Eagle StreamIntel Mountain Stream
Intel Birch StreamIntel Mountain Stream
Intel Birch Stream KernarchitekturSkylakeCascade LakeCascade LakeSunny CoveGolden CoveRaptor CoveRedwood Cove?Lion Cove? IPC-Verbesserung (im Vergleich zur vorherigen Generation)10 %0 %0 %20 %19 %8 %?35 %?39 %? MCP (Multi-Chip Package) SKUsNeinJaNeinNeinJaJaTBD (möglicherweise ja)TBD (möglicherweise ja) SockelLGA 3647LGA 3647LGA 4189LGA 4189LGA 4677LGA 4677TBDTBD Max. KernanzahlBis zu 28Bis zu 28Bis zu 28Bis zu 40Bis zu 56Bis zu 140?Bis zu 140? Max. FadenzahlBis zu 56Bis zu 56Bis zu 56Bis zu 80Bis zu 112Bis zu 128?Bis zu 240?Bis zu 288? Max. L3-Cache38,5 MB L338,5 MB L338,5 MB L360 MB L3105 MB L3120 MB L3?240 MB L3?288 MB L3? Vektor-EnginesAVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-1024/FMA3?AVX-1024/FMA3? SpeicherunterstützungDDR4-2666 6-KanalDDR4-2933 6-KanalBis zu 6-Kanal DDR4-3200Bis zu 8-Kanal DDR4-3200Bis zu 8-Kanal DDR5-4800Bis zu 8-Kanal DDR5-5600?Bis zu 12-Kanal DDR5-6400? Bis zu 12-Kanal DDR6-7200? PCIe Gen SupportPCIe 3.0 (48 Lanes)PCIe 3.0 (48 Lanes)PCIe 3.0 (48 Lanes)PCIe 4.0 (64 Lanes)PCIe 5.0 (80 Lanes)PCIe 5.0 (80 Lanes)PCIe 6.0 (128 Lanes)?PCIe 6.0 (128 Lanes )? TDP-Bereich (PL1)140W-205W165W-205W150W-250W105-270WBis zu 350WBis zu 375W?Bis zu 400W?Bis zu 425W? 3D Xpoint Optane DIMMN/AApache PassBarlow PassBarlow PassCrow PassCrow Pass?Donahue Pass?Donahue Pass? WettbewerbAMD EPYC Neapel 14nmAMD EPYC Rom 7nmAMD EPYC Rom 7nmAMD EPYC Mailand 7nm+AMD EPYC Genua ~5nmAMD Next-Gen EPYC (Post Genua)AMD Next-Gen EPYC (Post Genua)AMD Next-Gen EPYC (Post Genua) Launch201720182020202120222023?2024?2025 ?

Was die Fußnoten für die Intel Sapphire Rapids HBM „Xeon Scalable“-CPU-Leistung betrifft, können Sie sie unten sehen:

CloverLeaf

Test durch Intel am 26.04.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8360Y CPU, 72 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, Build-Knöpfe:-xCORE-AVX512 –qopt-zmm-usage=high Test von Intel am 19.04.22. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, ucode-Revision=0x83000200, CentOS Stream 8, Linux-Version 5.16, ifort 2021.5, Intel MPI 2021.5.1, Build-Regler:-xCORE-AVX512 –qopt-zmm-usage=high

OpenFOAM

Test von Intel am 26.01.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8380 CPU), 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank), BIOS-Version SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5, Linux-Version 4.18., OpenFOAM® v1912, Motorbike 28M @ 250 Iterationen; Build-Hinweise: Tools: Intel Parallel Studio 2020u4, Build-Regler:-O3-ip-xCORE-AVX512 Test von Intel am 26.01.2022 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor mit dem Codenamen Sapphire Rapids Plus HBM , >40 Kerne, HT aus, Turbo aus, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), Vorproduktionsplattform und BIOS, CentOS 8, Linux Version 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 Iterationen; Build-Hinweise: Tools: Intel Parallel Studio 2020u4, Build-Regler:-O3-ip-xCORE-AVX512

WRF

Test von Intel am 03.05.2022. 1 Knoten, 2 x Intel® Xeon® 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank), BIOS-Version SE5C6200.86B.0020.P23.2103261309, ucode-Revision=0xd000270, Rocky Linux 8.5, Linux Version 4.18, WRF v4.2.2 Test von Intel am 03.05.2022. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux Version 5.16, WRF v4.2.2

YASK

Test von Intel am 09.05.2022. 1 Knoten, 2x Intel® Xeon® Platinum 8360Y CPU, 72 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky Linux 8.5, Kernel 4.18.0, 0xd000270, Build-Regler: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, Test von Intel am 03.05.22. 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codename Sapphire Rapids Plus HBM, >40 Kerne, HT ON, Turbo ON, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), BIOS-Version EGSDCRB1.86B.0077.D11.2203281354, Ucode-Revision=0x83000200, CentOS Stream 8, Linux-Version 5.16, Build-Regler: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8,

Ansys Fluent

Test von Intel ab 2/2022 1-Knoten, 2x Intel® Xeon® Platinum 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB 3200 MT/s, Dual-Rank ), BIOS-Version SE5C6200.86B.0020.P23.2103261309, Ucode-Revision=0xd000270, Rocky Linux 8.5, Linux-Version 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-Hinweise: Kommerzielle Veröffentlichung mit Intel 19.3-Compiler und Intel MPI 2019u Test von Intel ab 2/2022 1-Knoten, 2x Vorproduktion Intel® Xeon® Scalable Processor Codenamen Sapphire Rapids mit HBM, >40 Kerne, HT aus, Turbo Aus, Gesamtspeicher 128 GB (HBM2e bei 3200 MHz), Vorproduktionsplattform und BIOS, CentOS 8, Linux-Version 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-Hinweise: Kommerzielle Version mit Intel 19.3-Compiler und Intel MPI 2019u8

Ansys ParSeNet

Test von Intel am 24.05.2022. 1 Knoten, 2 x Intel® Xeon® Platinum 8380 CPU, 80 Kerne, HT ein, Turbo ein, Gesamtspeicher 256 GB (16 x 16 GB DDR4 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Test von Intel ab 18.04.2022. 1-Knoten, 2x skalierbarer Intel® Xeon® Vorproduktionsprozessor mit dem Codenamen Sapphire Rapids Plus HBM, 112 Kerne, HT ein, Turbo ein, Gesamtspeicher 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Produkt-Build 20210904), oneDNN (v2.5.0)

Categories: IT Info