En SC21 (Supercomputing 2021), Intel presentó un resumen sesión en la que discutió su hoja de ruta del centro de datos de próxima generación y habló sobre sus próximas GPU Ponte Vecchio y las CPU Sapphire Rapids-SP Xeon.

Intel habla sobre las CPU Sapphire Rapids-SP Xeon & Ponte Vecchio GPU en SC21: también revela la línea de centros de datos de próxima generación para 2023+

Intel ya había discutido la mayoría de los detalles técnicos con respecto a su línea de CPU y GPU de centro de datos de próxima generación en Hot Chips 33. Están reafirmando lo que han dicho y también revelando algunas cositas más en SuperComputing 21.

Intel celebra el 50 aniversario de 4004: el primer microprocesador comercial del mundo: una retrospectiva

La generación actual de procesadores escalables Intel Xeon ha sido ampliamente adoptada por nuestro HPC socios del ecosistema, y ​​estamos agregando nuevas capacidades con Sapphire Rapids, nuestro procesador escalable Xeon de próxima generación que actualmente está probando con los clientes. Esta plataforma de próxima generación ofrece múltiples capacidades para el ecosistema HPC, brindando por primera vez memoria de alto ancho de banda en el paquete con HBM2e que aprovecha la arquitectura de múltiples mosaicos de Sapphire Rapids. Sapphire Rapids también ofrece un rendimiento mejorado, nuevos aceleradores, PCIe Gen 5 y otras emocionantes capacidades optimizadas para IA, análisis de datos y cargas de trabajo HPC.

Las cargas de trabajo HPC están evolucionando rápidamente. Se están volviendo más diversos y especializados, lo que requiere una mezcla de arquitecturas heterogéneas. Si bien la arquitectura x86 sigue siendo el caballo de batalla para las cargas de trabajo escalares, si queremos ofrecer ganancias de rendimiento de órdenes de magnitud y avanzar más allá de la era de la exaescala, debemos analizar críticamente cómo se ejecutan las cargas de trabajo de HPC dentro de las arquitecturas vectorial, matricial y espacial, y Debemos asegurarnos de que estas arquitecturas funcionen juntas sin problemas. Intel ha adoptado una estrategia de”carga de trabajo completa”, en la que los aceleradores específicos de la carga de trabajo y las unidades de procesamiento de gráficos (GPU) pueden trabajar sin problemas con las unidades de procesamiento central (CPU) desde las perspectivas de hardware y software.

Estamos implementando esta estrategia con nuestros procesadores escalables Intel Xeon de próxima generación y GPU Intel Xe HPC (nombre en código “Ponte Vecchio”) que impulsarán la supercomputadora Aurora de 2 exaflop en el Laboratorio Nacional de Argonne. Ponte Vecchio tiene la densidad de cómputo más alta por socket y por nodos, empaquetando 47 mosaicos con nuestras tecnologías de empaque avanzadas: EMIB y Foveros. Hay más de 100 aplicaciones HPC ejecutándose en Ponte Vecchio. También estamos trabajando con socios y clientes, incluidos ATOS, Dell, HPE, Lenovo, Inspur, Quanta y Supermicro, para implementar Ponte Vecchio en sus supercomputadoras más recientes.

a través de Intel

CPU de centro de datos Intel Sapphire Rapids-SP Xeon

Según Intel, Sapphire Rapids-SP vendrá en dos variantes de paquete, un estándar y una configuración HBM. La variante estándar contará con un diseño de chiplet compuesto por cuatro troqueles XCC que contarán con un tamaño de troquel de alrededor de 400 mm2. Este es el tamaño de dado para un dado XCC singular y habrá cuatro en total en el chip Sapphire Rapids-SP Xeon superior. Cada troquel se interconectará a través de EMIB, que tiene un tamaño de paso de 55u y un paso de núcleo de 100u.

El chip Sapphire Rapids-SP Xeon estándar contará con 10 interconexiones EMIB y todo el paquete medirá a un gran 4446mm2. Pasando a la variante HBM, estamos obteniendo un mayor número de interconexiones que se encuentran en 14 y son necesarias para interconectar la memoria HBM2E a los núcleos.

Intel Core i7-12800H Alder Lake-P CPU Benchmarks Leak También, hasta un 25% más rápido que la CPU AMD Ryzen 7 5800H en la prueba de un solo subproceso

Los cuatro paquetes de memoria HBM2E contarán con pilas de 8-Hi, por lo que Intel comprará al menos 16 GB de memoria HBM2E por apilar para un total de 64 GB en el paquete Sapphire Rapids-SP. Hablando del paquete, la variante de HBM medirá 5700 mm2 o un 28% más grande que la variante estándar. En comparación con los números de EPYC Genoa recientemente filtrados, el paquete HBM2E para Sapphire Rapids-SP terminaría siendo un 5% más grande, mientras que el paquete estándar será un 22% más pequeño.

Intel Sapphire Rapids-SP Xeon (paquete estándar)- 4446 mm2 Intel Sapphire Rapids-SP Xeon (paquete HBM2E)- 5700 mm2 AMD EPYC Genoa (paquete de 12 CCD)- 5428 mm2

Intel también afirma que El enlace EMIB proporciona el doble de mejora en la densidad del ancho de banda y una eficiencia energética 4 veces superior en comparación con los diseños de paquetes estándar. Curiosamente, Intel llama a la última línea de Xeon Lógicamente monolítica, lo que significa que se refieren a la interconexión que ofrecerá la misma funcionalidad que una matriz única, pero técnicamente hay cuatro chiplets que se interconectarán entre sí. Puede leer todos los detalles sobre las CPU estándar Sapphire Rapids-SP Xeon de 56 núcleos y 112 hilos aquí.

Familias Intel Xeon SP:

Family BrandingSkylake-SPCascade Lake-SP/APCooper Lake-SPIce Lake-SPSapphire RapidsEmerald Rapids Granite Rapids Nodo de proceso de Diamond Rapids 14nm + 14nm ++ 14nm ++ 10nm + Intel 7Intel 7Intel 4Intel 3? Nombre de la plataformaIntel PurleyIntel PurleyIntel Cedar IslandIntel WhitleyIntel Eagle StreamIntel Eagle StreamIntel Mountain Stream
Intel Birch StreamIntel Mountain Stream
Intel Birch Stream MCP (paquete de múltiples chips) SKUsNoSíNoNoSíTBDTBD (Posiblemente Sí) TBD (Posiblemente Sí) SocketLGALGA 464777 4677LGA 4677TBD Número máximo de núcleos Hasta 28 Hasta 28 Hasta 28 Hasta 40 Hasta 56 Hasta 64 ¿Hasta 120? TBD Número máximo de subprocesos Hasta 56 Hasta 56 Hasta 56 Hasta 80 Hasta 112 Hasta 128 ¿Hasta 240? TBD Max L3 Cache38.5 MB L338.5 MB L338.5 MB L360 MB L3105 MB L3120 MB L3? TBDTBD Soporte de memoria DDR4-2666 6 canales DDR4-2933 6 canales Hasta 6 canales DDR4-3200 Hasta 8 canales DDR4-3200 Hasta 8 canales DDR5-4800 Up A 8 canales DDR5-5600? TBDTBD PCIe Gen Support PCIe 3.0 (48 carriles) PCIe 3.0 (48 carriles) PCIe 3.0 (48 carriles) PCIe 4.0 (64 carriles) PCIe 5.0 (80 carriles) PCIe 5.0 PCIe 6.0? PCIe 6.0? Rango TDP140W-205W165W-205W150W-250W105-270W Hasta 350W Hasta 350WTBDTBD 3D Xpoint Optane DIMMN/AApache PassBarlow PassBarlow PassCrow PassCrow Pass? Donahue Pass? Donahue Pass? CompeticiónAMD EPYC Nápoles 14nmAMD EPYC Roma 7nmAMD EPYC Roma 7nmAMD EPYC Milán 7nm + AMD EPYC Genoa ~ 5nmAMD Next-Gen EPYC (Post Genoa) AMD Next-Gen EPYC (Post Genoa) AMD Next-Gen EPYC (Post Genoa) Lanzamiento20172018202020202022? ?

GPU de centro de datos Intel Ponte Vecchio

Pasando a Ponte Vecchio, Intel describió algunas características clave de su GPU de centro de datos insignia, como 128 núcleos Xe, 128 unidades RT, memoria HBM2e y un total de 8 GPU Xe-HPC que se conectarán entre sí. El chip contará con hasta 408 MB de caché L2 en dos pilas separadas que se conectarán a través de la interconexión EMIB. El chip contará con múltiples matrices basadas en el propio proceso’Intel 7’de Intel y los nodos de proceso N7/N5 de TSMC.

Intel también detalló previamente el paquete y el tamaño de la matriz de su GPU insignia Ponte Vecchio basada en Xe-Arquitectura HPC. El chip constará de 2 fichas con 16 dados activos por pila. El tamaño de matriz superior activo máximo será de 41 mm2, mientras que el tamaño de matriz base, que también se conoce como’Compute Tile’, es de 650 mm2.

La GPU Ponte Vecchio utiliza 8 HBM 8-Hi apila y contiene un total de 11 interconexiones EMIB. Todo el paquete Intel Ponte Vecchio mediría 4843,75 mm2. También se menciona que el tono de impacto para las CPU de Meteor Lake que usan el empaquetado Forveros 3D de alta densidad será de 36u.

Aparte de estos, Intel también publicó una hoja de ruta en la que confirman que el Xeon Sapphire de próxima generación La familia Rapids-SP y las GPU Ponte Vecchio estarán disponibles en 2022, pero también está la línea de productos de próxima generación que está planificada para 2023 y más allá. Intel no ha dicho explícitamente lo que planea traer, pero sabemos que el sucesor de Sapphire Rapids se conocerá como Emerald y Granite Rapids y el sucesor se conocerá como Diamond Rapids.

Para el lado de la GPU, no sabemos cuál será el sucesor de Ponte Vecchio, pero esperamos que compita con las GPU de próxima generación de NVIDIA y AMD para el mercado de centros de datos.

En el futuro, Intel tiene varias Soluciones para diseños de empaque avanzados como Forveros Omni y Forveros Direct al ingresar a la era Angstrom del desarrollo de transistores.

Aceleradores de GPU de centro de datos de próxima generación

Nombre del acelerador AMD Instinct MI200NVIDIA Hopper GH100Intel Ponte Vecchio Packaging Design MCM (Infinity Fabric) MCM (NVLINK) MCM (EMIB + Forveros) Arquitectura de GPU Aldebaran (CDNA 2) Hopper GH100Xe-HPC GPU Process Node6nm5nm? 7nm (Intel 4) Núcleos de GPU14,08018,432? 32,768? Velocidad de reloj de la GPU1700 MHzTBATBA FP16 Compute383 TOPsTBATBA FP32 Compute95.7 TFLOPsTBA ~ 45 TFLOPs (A0 Silicon) FP64 Compute47.9 TFLOPsTBATBA Capacidad de memoria128 GB HBM2E128 GB HBM2E? TBA Reloj de memoria3.2 GbpsTBATBA Bus de memoria 8w192192 bits. 2 TB/s ~ 2.5 TB/s? Factor de forma 5 TB/s Ranura doble, longitud completa/OAM Ranura doble, longitud completa/OAMOAM Enfriamiento Enfriamiento pasivo
Enfriamiento por líquido Enfriamiento pasivo
Enfriamiento por líquido Enfriamiento pasivo
Enfriamiento por líquido TDPQ4 20212H 20222022-2023?

Categories: IT Info