Intel ha demostrado una vez más sus próximas CPU Sapphire Rapids HBM Xeon Scalable con hasta 64 GB de memoria HBM2e en varios cargas de trabajo.
Intel promete triplicar el rendimiento con su línea de CPU Sapphire Rapids HBM’Xeon Scalable’de próxima generación
Según Intel, Sapphire Rapids-SP vendrá en dos variantes de paquete , un estándar y una configuración de HBM. La variante estándar contará con un diseño de chiplet compuesto por cuatro troqueles XCC que contarán con un tamaño de troquel de alrededor de 400 mm2. Este es el tamaño de dado para un solo dado XCC y habrá cuatro en total en el chip superior Sapphire Rapids-SP Xeon. Cada troquel estará interconectado a través de EMIB, que tiene un tamaño de paso de 55u y un paso de núcleo de 100u.
Intel presenta el puente Rialto: sucesor de IA de última generación de la GPU Ponte Vecchio Xe-HPC con hasta 160 Xe Núcleos, más de 20 000 ALU, OAM 2.0, muestreo en 2023
El procesador Intel Xeon con nombre en código Sapphire Rapids con memoria de alto ancho de banda (HBM) es un gran ejemplo de cómo estamos aprovechando las tecnologías de empaquetado avanzadas e innovaciones de silicio para brindar mejoras sustanciales de rendimiento, ancho de banda y ahorro de energía para HPC. Con hasta 64 gigabytes de memoria HBM2e de gran ancho de banda en el paquete y aceleradores integrados en la CPU, podemos liberar cargas de trabajo limitadas por el ancho de banda de la memoria y, al mismo tiempo, ofrecer mejoras de rendimiento significativas en los casos de uso clave de HPC.
Al comparar los procesadores escalables Intel Xeon de tercera generación con los próximos procesadores Sapphire Rapids HBM, observamos aumentos de rendimiento de dos a tres veces en las cargas de trabajo de investigación meteorológica, energía, fabricación y física2. En el discurso de apertura, el CTO de Ansys, Prith Banerjee, también muestra que Sapphire Rapids HBM ofrece un aumento del rendimiento de hasta 2 veces en las cargas de trabajo del mundo real de Ansys Fluent y ParSeNet.
El chip Sapphire Rapids-SP Xeon estándar contará con 10 interconexiones EMIB y el paquete completo medirá 4446 mm2. Pasando a la variante HBM, estamos obteniendo un mayor número de interconexiones que se ubican en 14 y son necesarias para interconectar la memoria HBM2E a los núcleos.
Los cuatro paquetes de memoria HBM2E contará con pilas 8-Hi, por lo que Intel buscará al menos 16 GB de memoria HBM2E por pila para un total de 64 GB en el paquete Sapphire Rapids-SP. Hablando del paquete, la variante de HBM medirá unos increíbles 5700 mm2 o un 28 % más que la variante estándar. En comparación con las cifras de EPYC Genoa filtradas recientemente, el paquete HBM2E para Sapphire Rapids-SP terminaría siendo un 5 % más grande, mientras que el paquete estándar será un 22 % más pequeño.
Intel Sapphire Rapids-SP Xeon (paquete estándar)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (paquete HBM2E)- 5700 mm2 AMD EPYC Génova (paquete de 12 CCD)- 5428 mm2
Intel Falcon Shores XPU llevará la computación de alto rendimiento al extremo con configuraciones de GPU Xe y CPU x86 de varios mosaicos, apuntando a más de 5 veces el rendimiento por vatio
Intel también afirma que el enlace EMIB proporciona el doble de ancho de banda mejora de la densidad y 4 veces mejor eficiencia energética en comparación con los diseños de paquete estándar. Curiosamente, Intel llama a la última línea de Xeon Lógicamente monolítica, lo que significa que se refieren a la interconexión que ofrecerá la misma funcionalidad que una matriz única, pero técnicamente, hay cuatro chipsets que se interconectarán entre sí. Puede leer los detalles completos sobre las CPU estándar Sapphire Rapids-SP Xeon de 56 núcleos y 112 subprocesos aquí.
Familias Intel Xeon SP (preliminar):
En cuanto a las notas a pie de página sobre el rendimiento de la CPU Intel Sapphire Rapids HBM’Xeon Scalable’, puede verlas a continuación:
CloverLeaf
Prueba por Intel al 26/04/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT On, Turbo On, Memoria total 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, controles de compilación:-xCORE-AVX512 –qopt-zmm-usage=high Prueba realizada por Intel a partir del 19/04/22. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, revisión de ucode=0x83000200, CentOS Stream 8, versión de Linux 5.16, ifort 2021.5, Intel MPI 2021.5.1, botones de compilación:-xCORE-AVX512 –qopt-zmm-usage=high
OpenFOAM
Prueba de Intel a partir del 26/01/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380), 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango), versión de BIOS SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5, Linux versión 4.18., OpenFOAM® v1912, Moto 28M @ 250 iteraciones; Notas de compilación: Herramientas: Intel Parallel Studio 2020u4, botones de compilación:-O3-ip-xCORE-AVX512 Prueba realizada por Intel a partir del 26/01/2022 Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM , >40 núcleos, HT Off, Turbo Off, Memoria total 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, Linux versión 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 iteraciones; Notas de compilación: herramientas: Intel Parallel Studio 2020u4, perillas de compilación:-O3-ip-xCORE-AVX512
WRF
Probado por Intel a partir del 03/05/2022. 1 nodo, 2 CPU Intel® Xeon® 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango), versión de BIOS SE5C6200.86B.0020.P23.2103261309, revisión de ucode=0xd000270, Rocky Linux 8.5, Linux versión 4.18, WRF v4.2.2 Prueba de Intel a partir del 03/05/2022. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versión 5.16, WRF v4.2.2
YASK
Prueba realizada por Intel a partir del 9/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky Linux 8.5, kernel 4.18.0, 0xd000270, perillas de compilación: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8, prueba de Intel a partir del 03/05/22. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, revisión de ucode=0x83000200, CentOS Stream 8, versión de Linux 5.16, perillas de compilación: make-j YK_CXX=’mpiicpc-cxx=icpx’arch=avx2 stencil=iso3dfd radius=8,
Ansys Fluent
Prueba de Intel a fecha de 2/2022 1 nodo, 2 CPU Intel ® Xeon ® Platinum 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16×16 GB 3200 MT/s, doble rango ), versión de BIOS SE5C6200.86B.0020.P23.2103261309, revisión de ucode=0xd000270, Rocky Linux 8.5, versión de Linux 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: Lanzamiento comercial con el compilador Intel 19.3 e Intel MPI 2019u Prueba realizada por Intel a partir de 2/2022 Procesador escalable Intel® Xeon® de preproducción de 1 nodo, 2 nombres en código Sapphire Rapids con HBM, >40 núcleos, HT desactivado, Turbo Apagado, memoria total de 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, versión de Linux 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: lanzamiento comercial con el compilador Intel 19.3 e Intel MPI 2019u8
Ansys ParSeNet
probado por Intel a partir del 24/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380, 80 núcleos, HT activado, Turbo activado, memoria total de 256 GB (16 DDR4 de 16 GB 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0) Prueba de Intel a partir de 18/04/2022. 1 nodo, 2 procesadores escalables Intel® Xeon® de preproducción con nombre en código Sapphire Rapids Plus HBM, 112 núcleos, HT activado, Turbo activado, memoria total de 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)