Intel heeft opnieuw zijn aanstaande Sapphire Rapids HBM Xeon schaalbare CPU’s gedemonstreerd met tot 64 GB HBM2e-geheugen in verschillende workloads.
Intel belooft 3x prestatieverbetering met zijn Next-Gen Sapphire Rapids HBM’Xeon Scalable’CPU Line-up
Volgens Intel zal de Sapphire Rapids-SP in twee pakketvarianten komen , een standaard en een HBM-configuratie. De standaardvariant zal een chiplet-ontwerp hebben dat bestaat uit vier XCC-stempels met een matrijsgrootte van ongeveer 400 mm2. Dit is de grootte van de matrijs voor een enkelvoudige XCC-matrijs en er zullen er in totaal vier zijn op de bovenste Sapphire Rapids-SP Xeon-chip. Elke chip wordt met elkaar verbonden via EMIB met een pitchgrootte van 55u en een core pitch van 100u.
Intel onthult Rialtobrug: de volgende generatie AI-opvolger van Ponte Vecchio Xe-HPC GPU met maximaal 160 Xe Cores, meer dan 20.000 ALU’s, OAM 2.0, sampling in 2023
De Intel Xeon-processor met de codenaam Sapphire Rapids met High Bandwidth Memory (HBM) is een goed voorbeeld van hoe we gebruikmaken van geavanceerde verpakkingstechnologieën en siliciuminnovaties om substantiële prestatie-, bandbreedte-en energiebesparende verbeteringen voor HPC te brengen. Met tot 64 gigabyte HBM2e-geheugen met hoge bandbreedte in het pakket en accelerators die in de CPU zijn geïntegreerd, zijn we in staat om geheugenbandbreedte-gebonden workloads te ontketenen en tegelijkertijd aanzienlijke prestatieverbeteringen te leveren in belangrijke HPC-gebruiksscenario’s.
Wanneer we 3e generatie Intel Xeon Scalable-processors vergelijken met de aankomende Sapphire Rapids HBM-processors, zien we een twee-tot driemaal hogere prestatie bij weersonderzoek, energie, productie en fysica-workloads2. Tijdens de keynote laat Ansys CTO Prith Banerjee ook zien dat Sapphire Rapids HBM tot 2x prestatieverhoging levert op real-world workloads van Ansys Fluent en ParSeNet.
De standaard Sapphire Rapids-SP Xeon-chip zal 10 EMIB-interconnects bevatten en het hele pakket zal een indrukwekkende 4446 mm2 meten. Als we overgaan op de HBM-variant, krijgen we een groter aantal interconnects die 14 zitten en die nodig zijn om het HBM2E-geheugen met de cores te verbinden.
De vier HBM2E-geheugenpakketten zal 8-Hi-stacks bevatten, dus Intel gaat voor ten minste 16 GB HBM2E-geheugen per stack voor een totaal van 64 GB voor het Sapphire Rapids-SP-pakket. Over het pakket gesproken, de HBM-variant zal een waanzinnige 5700 mm2 of 28% groter meten dan de standaardvariant. Vergeleken met de recent gelekte EPYC Genua-nummers, zou het HBM2E-pakket voor Sapphire Rapids-SP 5% groter uitvallen, terwijl het standaardpakket 22% kleiner zal zijn.
Intel Sapphire Rapids-SP Xeon (Standaardpakket)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (HBM2E-pakket)- 5700 mm2 AMD EPYC Genua (12 CCD-pakket)- 5428 mm2
Intel Falcon Shores XPU om high-performance computing tot het uiterste te pushen met multi-tiled x86 CPU & Xe GPU-configuraties, gericht op meer dan 5x prestaties per watt
Intel stelt ook dat de EMIB-link twee keer de bandbreedte biedt dichtheidsverbetering en 4 keer betere energie-efficiëntie in vergelijking met standaard pakketontwerpen. Interessant is dat Intel de nieuwste Xeon-reeks Logisch monolithisch noemt, wat betekent dat ze verwijzen naar de interconnect die dezelfde functionaliteit biedt als een single-die, maar technisch gezien zijn er vier chiplets die met elkaar verbonden zullen zijn. U kunt de volledige details over de standaard 56 core & 112 thread Sapphire Rapids-SP Xeon CPU’s hier lezen.
Intel Xeon SP Families (voorlopig):
Wat betreft de voetnoten voor de Intel Sapphire Rapids HBM’Xeon Scalable’CPU-prestaties, je kunt ze hieronder bekijken: ClverLeaf Test door Intel vanaf 26-04-2022. 1-node, 2x Intel® Xeon® Platinum 8360Y CPU, 72 cores, HT aan, turbo aan, totaal geheugen 256GB (16x16GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, bouwknoppen:-xCORE-AVX512 –qopt-zmm-usage=high Test door Intel vanaf 19-04-22. 1-node, 2x Pre-productie Intel® Xeon® schaalbare processor met codenaam Sapphire Rapids Plus HBM, >40 cores, HT ON, Turbo ON, totaal geheugen 128 GB (HBM2e op 3200 MHz), BIOS-versie EGSDCRB1.86B.0077.D11.2203281354, ucode-revisie=0x83000200, CentOS Stream 8, Linux-versie 5.16, ifort 2021.5, Intel MPI 2021.5.1, bouwknoppen:-xCORE-AVX512 –qopt-zmm-usage=high OpenFOAM Test door Intel vanaf 26/01/2022. 1-node, 2x Intel® Xeon® Platinum 8380 CPU), 80 cores, HT On, Turbo On, Totaal geheugen 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS-versie SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5 , Linux versie 4.18., OpenFOAM® v1912, Motorbike 28M @ 250 iteraties; Build-opmerkingen: Tools: Intel Parallel Studio 2020u4, Build-knoppen:-O3-ip-xCORE-AVX512 Test door Intel vanaf 26/01/2022 1-node, 2x Pre-productie Intel® Xeon® schaalbare processor met codenaam Sapphire Rapids Plus HBM , >40 cores, HT Off, Turbo Off, totaal geheugen 128 GB (HBM2e op 3200 MHz), preproductieplatform en BIOS, CentOS 8, Linux-versie 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 iteraties; Build-opmerkingen: Tools: Intel Parallel Studio 2020u4, Build-knoppen:-O3-ip-xCORE-AVX512 WRF Test door Intel vanaf 05/03/2022. 1-node, 2x Intel® Xeon® 8380 CPU, 80 cores, HT Aan, Turbo Aan, Totaal geheugen 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS-versie SE5C6200.86B.0020.P23.2103261309, ucode-revisie=0xd000270, Rocky Linux 8.5, Linux versie 4.18, WRF v4.2.2 Test door Intel vanaf 05/03/2022. 1-node, 2x Pre-productie Intel® Xeon® schaalbare processor met codenaam Sapphire Rapids Plus HBM, >40 cores, HT ON, Turbo ON, totaal geheugen 128 GB (HBM2e op 3200 MHz), BIOS-versie EGSDCRB1.86B.0077.D11.2203281354, ucode-revisie=0x83000200, CentOS Stream 8, Linux-versie 5.16, WRF v4.2.2 YASK Test door Intel vanaf 05/9/2022. 1-node, 2x Intel® Xeon® Platinum 8360Y CPU, 72 cores, HT aan, turbo aan, totaal geheugen 256GB (16x16GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky linux 8.5, kernel 4.18.0, 0xd000270, Build-knoppen: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, Test door Intel vanaf 05/03/22. 1-node, 2x Pre-productie Intel® Xeon® schaalbare processor met codenaam Sapphire Rapids Plus HBM, >40 cores, HT ON, Turbo ON, totaal geheugen 128 GB (HBM2e op 3200 MHz), BIOS-versie EGSDCRB1.86B.0077.D11.2203281354, ucode-revisie=0x83000200, CentOS Stream 8, Linux-versie 5.16, Build-knoppen: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, Ansys Fluent Test door Intel vanaf 2/2022 1-node, 2x Intel ® Xeon ® Platinum 8380 CPU, 80 cores, HT aan, turbo aan, totaal geheugen 256 GB (16×16 GB 3200MT/s, dual-Rank ), BIOS-versie SE5C6200.86B.0020.P23.2103261309, ucode-revisie=0xd000270, Rocky Linux 8.5, Linux-versie 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-opmerkingen: Commerciële release met Intel 19.3-compiler en Intel MPI 2019u Test door Intel vanaf 2/2022 1-node, 2x Pre-productie Intel® Xeon® Scalable Processor codenamen Sapphire Rapids met HBM, >40 cores, HT Off, Turbo Uit, totaal geheugen 128 GB (HBM2e op 3200 MHz), preproductieplatform en BIOS, CentOS 8, Linux-versie 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Build-opmerkingen: Commerciële release met Intel 19.3-compiler en Intel MPI 2019u8 Ansys ParSeNet Test door Intel vanaf 24/05/2022. 1-node, 2x Intel® Xeon® Platinum 8380 CPU, 80 cores, HT aan, turbo aan, totaal geheugen 256GB (16x16GB DDR4 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Test door Intel vanaf 18-04-2022. 1-node, 2x Pre-productie Intel® Xeon® Scalable Processor met codenaam Sapphire Rapids Plus HBM, 112 cores, HT On, Turbo On, Totaal geheugen 128GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)
Intel Birch StreamIntel Mountain Stream
Intel Birch Stream Core ArchitectureSkylakeCascade LakeCascade LakeSunny CoveGolden CoveRaptor CoveRedwood Cove?Lion Cove? IPC-verbetering (vs vorige generatie)10%0%0%20%19%8%?35%?39%? MCP (Multi-Chip Package) SKU’sNeeJaNeeNeeJaJaTBD (Mogelijk Ja)TBD (Mogelijk Ja) SocketLGA 3647LGA 3647LGA 4189LGA 4189LGA 4677LGA 4677TBDTBD Max. aantal kernenTot 28Tot 28Tot 28Tot 40Tot 56Tot 64?Tot 120?Tot 144? Max. aantal threadsTot 56Tot 56Tot 56Tot 80Tot 112Tot 128?Tot 240?Tot 288? Max. L3-cache38.5 MB L338.5 MB L338.5 MB L360 MB L3105 MB L3120 MB L3?240 MB L3?288 MB L3? Vector EnginesAVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-1024/FMA3?AVX-1024/FMA3? GeheugenondersteuningDDR4-2666 6-kanaalsDDR4-2933 6-kanaalsTot 6-kanaals DDR4-3200Tot 8-kanaals DDR4-3200Tot 8-kanaals DDR5-4800Tot 8-kanaals DDR5-5600?Tot 12-kanaals DDR5-6400? Tot 12-kanaals DDR6-7200? PCIe Gen-ondersteuningPCIe 3.0 (48 Lanes)PCIe 3.0 (48 Lanes)PCIe 3.0 (48 Lanes)PCIe 4.0 (64 Lanes)PCIe 5.0 (80 Lanes)PCIe 5.0 (80 Lanes)PCIe 6.0 (128 Lanes) PCIe 6.0 (128 Lanes )? TDP-bereik (PL1)140W-205W165W-205W150W-250W105-270WTot 350WTot 375W?Tot 400W?Tot 425W? 3D Xpoint Optane DIMMN/AApache PassBarlow PassBarlow PassCrow PassCrow Pass?Donahue Pass?Donahue Pass? CompetitieAMD EPYC Napels 14nmAMD EPYC Rome 7nmAMD EPYC Rome 7nmAMD EPYC Milaan 7nm+AMD EPYC Genua ~5nmAMD Next-Gen EPYC (Post Genua)AMD Next-Gen EPYC (Post Genua)AMD Next-Gen EPYC (Post Genua) Launch2017232018?2020 ?