Intel ha demostrado una vez más sus próximas CPU Sapphire Rapids HBM Xeon Scalable con hasta 64 GB de memoria HBM2e en varios cargas de trabajo.

Intel promete triplicar el rendimiento con su línea de CPU Sapphire Rapids HBM’Xeon Scalable’de próxima generación

Según Intel, Sapphire Rapids-SP vendrá en dos variantes de paquete , un estándar y una configuración de HBM. La variante estándar contará con un diseño de chiplet compuesto por cuatro troqueles XCC que contarán con un tamaño de troquel de alrededor de 400 mm2. Este es el tamaño de dado para un solo dado XCC y habrá cuatro en total en el chip superior Sapphire Rapids-SP Xeon. Cada troquel estará interconectado a través de EMIB, que tiene un tamaño de paso de 55u y un paso de núcleo de 100u.

Intel presenta el puente Rialto: sucesor de IA de última generación de la GPU Ponte Vecchio Xe-HPC con hasta 160 Xe Núcleos, más de 20 000 ALU, OAM 2.0, muestreo en 2023

El procesador Intel Xeon con nombre en código Sapphire Rapids con memoria de alto ancho de banda (HBM) es un gran ejemplo de cómo estamos aprovechando las tecnologías de empaquetado avanzadas e innovaciones de silicio para brindar mejoras sustanciales de rendimiento, ancho de banda y ahorro de energía para HPC. Con hasta 64 gigabytes de memoria HBM2e de gran ancho de banda en el paquete y aceleradores integrados en la CPU, podemos liberar cargas de trabajo limitadas por el ancho de banda de la memoria y, al mismo tiempo, ofrecer mejoras de rendimiento significativas en los casos de uso clave de HPC.

Al comparar los procesadores escalables Intel Xeon de tercera generación con los próximos procesadores Sapphire Rapids HBM, observamos aumentos de rendimiento de dos a tres veces en las cargas de trabajo de investigación meteorológica, energía, fabricación y física2. En el discurso de apertura, el CTO de Ansys, Prith Banerjee, también muestra que Sapphire Rapids HBM ofrece un aumento del rendimiento de hasta 2 veces en las cargas de trabajo del mundo real de Ansys Fluent y ParSeNet.

El chip Sapphire Rapids-SP Xeon estándar contará con 10 interconexiones EMIB y el paquete completo medirá 4446 mm2. Pasando a la variante HBM, estamos obteniendo un mayor número de interconexiones que se ubican en 14 y son necesarias para interconectar la memoria HBM2E a los núcleos.

Los cuatro paquetes de memoria HBM2E contará con pilas 8-Hi, por lo que Intel buscará al menos 16 GB de memoria HBM2E por pila para un total de 64 GB en el paquete Sapphire Rapids-SP. Hablando del paquete, la variante de HBM medirá unos increíbles 5700 mm2 o un 28 % más que la variante estándar. En comparación con las cifras de EPYC Genoa filtradas recientemente, el paquete HBM2E para Sapphire Rapids-SP terminaría siendo un 5 % más grande, mientras que el paquete estándar será un 22 % más pequeño.

Intel Sapphire Rapids-SP Xeon (paquete estándar)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (paquete HBM2E)- 5700 mm2 AMD EPYC Génova (paquete de 12 CCD)- 5428 mm2

Intel Falcon Shores XPU llevará la computación de alto rendimiento al extremo con configuraciones de GPU Xe y CPU x86 de varios mosaicos, apuntando a más de 5 veces el rendimiento por vatio

Intel también afirma que el enlace EMIB proporciona el doble de ancho de banda mejora de la densidad y 4 veces mejor eficiencia energética en comparación con los diseños de paquete estándar. Curiosamente, Intel llama a la última línea de Xeon Lógicamente monolítica, lo que significa que se refieren a la interconexión que ofrecerá la misma funcionalidad que una matriz única, pero técnicamente, hay cuatro chipsets que se interconectarán entre sí. Puede leer los detalles completos sobre las CPU estándar Sapphire Rapids-SP Xeon de 56 núcleos y 112 subprocesos aquí.

Familias Intel Xeon SP (preliminar):

Family BrandingSkylake-SPCascade Lake-SP/APCooper Lake-SPIce Lake-SPSapphire RapidsEmerald RapidsGranite RapidsDiamond Rapids Process Node14nm+14nm++14nm++10nm+Intel 7Intel 7Intel 3Intel 3? Nombre de la plataformaIntel PurleyIntel PurleyIntel Cedar IslandIntel WhitleyIntel Eagle StreamIntel Eagle StreamIntel Mountain Stream
Intel Birch StreamIntel Mountain Stream
Intel Birch Stream Core ArchitectureSkylakeCascade LakeCascade LakeSunny CoveGolden CoveRaptor CoveRedwood Cove?Lion Cove? Mejora de IPC (frente a la generación anterior)10%0%0%20%19%8%?35%?39%? MCP (paquete de chips múltiples) SKUNoSíNoNoSíSíTBD (posiblemente sí)TBD (posiblemente sí) SocketLGA 3647LGA 3647LGA 4189LGA 4189LGA 4677LGA 4677TBDTBD Recuento máximo de núcleosHasta 28Hasta 28Hasta 28Hasta 40Hasta 56Hasta 64?Hasta 144?Hasta 120 Cantidad máxima de hilosHasta 56Hasta 56Hasta 56Hasta 80Hasta 112Hasta 128?Hasta 240?Hasta 288? Max L3 Cache38.5 MB L338.5 MB L338.5 MB L360 MB L3105 MB L3120 MB L3?240 MB L3?288 MB L3? Motores vectoriales AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-512/FMA2AVX-1024/FMA3?AVX-1024/FMA3? Compatibilidad con memoria DDR4-2666 6 canales DDR4-2933 6 canales Hasta 6 canales DDR4-3200 Hasta 8 canales DDR4-3200 Hasta 8 canales DDR5-4800 Hasta 8 canales DDR5-5600 ¿Hasta 12 canales DDR5-6400? ¿Hasta DDR6-7200 de 12 canales? Compatibilidad con PCIe GenPCIe 3.0 (48 carriles)PCIe 3.0 (48 carriles)PCIe 3.0 (48 carriles)PCIe 4.0 (64 carriles)PCIe 5.0 (80 carriles)PCIe 5.0 (80 carriles)PCIe 6.0 (128 carriles)?PCIe 6.0 (128 carriles) )? Rango TDP (PL1)140W-205W165W-205W150W-250W105-270WHasta 350WHasta 375W?Hasta 400W?Hasta 425W? 3D Xpoint Optane DIMMN/AApache PassBarlow PassBarlow PassCrow PassCrow Pass?Donahue Pass?Donahue Pass? CompetenciaAMD EPYC Nápoles 14nmAMD EPYC Roma 7nmAMD EPYC Roma 7nmAMD EPYC Milán 7nm+AMD EPYC Génova ~5nmAMD Next-Gen EPYC (posterior a Génova)AMD Next-Gen EPYC (posterior a Génova)AMD Next-Gen EPYC (posterior a Génova) Lanzamiento201720182020202120222024?20252 ?

En cuanto a las notas a pie de página sobre el rendimiento de la CPU Intel Sapphire Rapids HBM’Xeon Scalable’, puede verlas a continuación:

CloverLeaf

Prueba por Intel al 26/04/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT On, Turbo On, Memoria total 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, controles de compilación:-xCORE-AVX512 –qopt-zmm-usage=high Prueba realizada por Intel a partir del 19/04/22. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, revisión de ucode=0x83000200, CentOS Stream 8, versión de Linux 5.16, ifort 2021.5, Intel MPI 2021.5.1, botones de compilación:-xCORE-AVX512 –qopt-zmm-usage=high

OpenFOAM

Prueba de Intel a partir del 26/01/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380), 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango), versión de BIOS SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5, Linux versión 4.18., OpenFOAM® v1912, Moto 28M @ 250 iteraciones; Notas de compilación: Herramientas: Intel Parallel Studio 2020u4, botones de compilación:-O3-ip-xCORE-AVX512 Prueba realizada por Intel a partir del 26/01/2022 Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM , >40 núcleos, HT Off, Turbo Off, Memoria total 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, Linux versión 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 iteraciones; Notas de compilación: herramientas: Intel Parallel Studio 2020u4, perillas de compilación:-O3-ip-xCORE-AVX512

WRF

Probado por Intel a partir del 03/05/2022. 1 nodo, 2 CPU Intel® Xeon® 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango), versión de BIOS SE5C6200.86B.0020.P23.2103261309, revisión de ucode=0xd000270, Rocky Linux 8.5, Linux versión 4.18, WRF v4.2.2 Prueba de Intel a partir del 03/05/2022. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versión 5.16, WRF v4.2.2

YASK

Prueba realizada por Intel a partir del 9/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky Linux 8.5, kernel 4.18.0, 0xd000270, perillas de compilación: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, prueba de Intel a partir del 03/05/22. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, revisión de ucode=0x83000200, CentOS Stream 8, versión de Linux 5.16, perillas de compilación: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8,

Ansys Fluent

Prueba de Intel a fecha de 2/2022 1 nodo, 2 CPU Intel ® Xeon ® Platinum 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango ), versión de BIOS SE5C6200.86B.0020.P23.2103261309, revisión de ucode=0xd000270, Rocky Linux 8.5, versión de Linux 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: Lanzamiento comercial con el compilador Intel 19.3 e Intel MPI 2019u Prueba realizada por Intel a partir de 2/2022 Procesador escalable Intel® Xeon® de preproducción de 1 nodo, 2 nombres en código Sapphire Rapids con HBM, >40 núcleos, HT desactivado, Turbo Apagado, memoria total de 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, versión de Linux 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: lanzamiento comercial con el compilador Intel 19.3 e Intel MPI 2019u8

Ansys ParSeNet

probado por Intel a partir del 24/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16 DDR4 de 16 GB 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Prueba de Intel a partir de 18/04/2022. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, 112 núcleos, HT activado, Turbo activado, memoria total de 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)

Categories: IT Info