Ahora que la 4.ª generación Xeon Scalable”Sapphire Rapids”y la descripción general de la serie Xeon CPU Max están fuera del camino, probablemente esté ansioso por ver algunos puntos de referencia de rendimiento independientes de las tan esperadas CPU Sapphire Rapids que se enfrentan a AMD Procesadores EPYC”Genoa”de 4.ª generación para 2023… Para dar inicio a nuestra evaluación comparativa de Sapphire Rapids, lo primero es echar un vistazo al rendimiento de Xeon Platinum 8490H en Linux como SKU insignia.

Como resumen de las especificaciones de Xeon Platinum 8490H que también se presentaron en la descripción general de Sapphire Rapids, este procesador insignia cuenta con 60 núcleos/120 subprocesos, una frecuencia base de 1,9 GHz, una frecuencia turbo de todos los núcleos de 2,9 GHz, un máximo de 3,5 GHz frecuencia turbo y ocho canales de memoria DDR5-4800. El 8490H tiene una memoria caché de 112,5 MB y tiene una calificación de TDP de 350 vatios.

En el frente del acelerador, el Xeon Platinum 8490H está maximizado con cuatro dispositivos DSA, cuatro dispositivos QAT, cuatro dispositivos DLB y cuatro dispositivos IAA; por lo tanto, aquí no hay Intel On Demand, todos las capacidades de hardware están presentes y habilitadas para este SKU insignia. El precio recomendado para el cliente del Xeon Platinum 8490H es de $17 000 USD.

El Xeon Platinum 8490H se compara con el buque insignia actual de AMD en la línea de Génova, el EPYC 9654. El EPYC 9654 como recordatorio tiene 96 núcleos/192 subprocesos, reloj base de 2,4 GHz, impulso de todos los núcleos hasta 3,55 GHz y un reloj de impulso máximo de 3,7 GHz. El EPYC 9654 tiene un TDP predeterminado de 360 ​​vatios. Las CPU AMD EPYC Genoa admiten DDR5-4800 de 12 canales en comparación con DDR5-4800 de 8 canales con los SKU Sapphire Rapids de gama alta. Pero Genoa carece de aceleradores dedicados como los que se encuentran con Sapphire Rapids ni hay AMX con las nuevas piezas de AMD; solo ahora con Zen 4 AMD es compatible con AVX-512, años después de que las CPU de servidor de Intel se enviaran por primera vez con él. El EPYC 9654 tiene un precio de lista notablemente más bajo que el 8490H a $11,805 USD. Sin embargo, será interesante ver cómo se desarrollan la disponibilidad y los precios tanto para Génova como para Sapphire Rapids en las próximas semanas/meses.

Más cercano en especificaciones al Xeon Platinum 8490H es el EPYC 9554, que tiene 64 núcleos/128 subprocesos y tiene un TDP de 360 ​​vatios… Sin embargo, también tiene una ventaja: un reloj base de 3,1 GHz, un reloj de refuerzo de 3,75 GHz y 256 MB de caché L3. Una vez más, sin embargo, no hay aceleradores ni AMX, pero al menos tiene una ventaja de velocidad de reloj para beneficio en todas las cargas de trabajo, soporte de memoria de doce canales y un tamaño de caché más grande. El EPYC 9554 tiene un precio de lista de $9087 USD, o solo el 53 % del precio de lista del 8490H.

Por mucho que me gusten los servidores de bombardeo de alfombras con puntos de referencia, esta prueba inicial del Xeon Platinum 8490H es bastante limitada. Desafortunadamente, debido a las vacaciones y otros factores por su parte, Intel solo envió el servidor la semana pasada y lo recibió el pasado viernes (6 de enero). Por lo tanto, han sido cuatro días ininterrumpidos de evaluación comparativa… Apenas tiempo suficiente para enfatizar la plataforma tanto como me gustaría a tiempo para la revisión del día del lanzamiento, especialmente con algunos revisores que recibieron su hardware en diciembre. Por lo tanto, en este artículo son solo mis puntos de referencia preliminares para las cargas de trabajo probadas existentes que pude completar a tiempo. Muchos más puntos de referencia estarán en camino cuando tenga más tiempo con este servidor.

Especialmente en el frente del acelerador será bastante interesante. Debido a la ventana de cuatro días de recibir el hardware de Sapphire Rapids para levantar el embargo, los puntos de referencia de hoy no se centran en el lado del acelerador debido al corto período de tiempo para preparar mis pruebas adecuadamente para configurarlos y verificar el correcto funcionamiento. etc. Como parte del material de los revisores, Intel proporcionó algunos puntos de referencia acelerados de muestra que recomiendan, pero no permiten la redistribución pública de esos activos después del lanzamiento. Con mi enfoque de larga data en la transparencia y la reproducibilidad de los resultados de las pruebas comparativas de cualquiera/todas las partes, no es interesante ejecutar algunos scripts proporcionados por proveedores que el público en general no puede obtener para evaluar en su propio hardware al calcular los beneficios de la actualización o analizar el software. implementación. Por lo tanto, configuraré mis propios puntos de referencia de aceleradores a partir de los repositorios públicos de código ya preparados para Sapphire Rapids, etc. comienza a admitir la nueva IP del acelerador de Sapphire Rapids.

Fue un poco interesante que tanto el servidor de referencia Titanite 2P de AMD para Génova como el Sapphire de Intel La plataforma de servidor de referencia Rapids Eagle Stream fue fabricada por Quanta Computer.

Desde el exterior, los servidores de referencia AMD Titanite e Intel Eagle Stream se ven bastante similares e incluso los diseños del disipador térmico y la refrigeración son más similares de lo que hemos visto en el pasado de los servidores de referencia de AMD e Intel de cada generación.

Los procesadores probados para esta comparación de Sapphire Rapids el día del lanzamiento con el Xeon Platinum 8490H incluidos el:

-AMD EPYC 7713
-AMD EPYC 7763
-AMD EPYC 7773X
-AMD EPYC 9374F
-AMD EPYC 9554
-AMD EPYC 9654
-Intel Xeon Platinum 8362
-Intel Xeon Platinum 8380
-Intel Xeon Platinum 8490H

Todos los procesadores se probaron en configuraciones de zócalo simple y doble. Cada procesador se ejecutaba a su máxima frecuencia nominal y configuración de canal de memoria y usaba almacenamiento NVMe de la serie Micron 9300 respaldado. Detalles adicionales de hardware en la tabla del sistema.

Según mi apariencia habitual de software de última generación, esta ronda de evaluación comparativa se realizó con Ubuntu 22.10 con el kernel de Linux 6.0. Para aquellos que se preguntan sobre el rendimiento de Ubuntu LTS, RHEL/AlmaLinux y otras distribuciones de Linux como Clear Linux en Sapphire Rapids, como de costumbre, habrá un artículo de seguimiento que analiza el rendimiento de Xeon Platinum 8490H en una variedad de entornos Linux (y BSD también). si va bien). GCC 12.2 fue el compilador de código predeterminado utilizado en todos los ámbitos. Todos los procesadores se probaron con el gobernador de escalado de frecuencia de CPU de”rendimiento”en Linux 6.0.

Durante el proceso de evaluación comparativa, el consumo de energía del paquete de CPU también se supervisó y registró utilizando el interfaces RAPL expuestas. También hay métricas de rendimiento por dólar: para Ice Lake y Milan(X) utilizando los precios más recientes disponibles para NewEgg como referencia fácil. El precio de Sapphire Rapids y Génova se basó en la lista de precios sugerida por cada proveedor para no tener ninguna lista todavía en los principales minoristas de Internet.

Vamos a ver cómo se ve el rendimiento de Sapphire Rapids en comparación con la generación anterior Ice Lake y luego los procesadores de servidor Genoa y Milan(X) de AMD en Ubuntu Linux.

Dado el enfoque significativo de Intel de esta generación en las cargas de trabajo de IA y el creciente interés de la industria allí, comencemos esta evaluación comparativa con algunos números utilizando los propios de Intel Software OpenVINO que ha disfrutado de optimizaciones para que Sapphire Rapids muestre su potencial:

Al pasar de AMD EPYC Milan(X) a Génova, me quedé anonadado en noviembre con el rendimiento de OpenVINO ahora que EPYC tiene AVX-512 con Zen 4… Pero con los resultados de OpenVINO en Sapphire Rapids, me sentí abrumado por la emoción de la actuación. Por supuesto, OpenVINO es un software de código abierto desarrollado por Intel y ha sido optimizado para procesadores Intel. Gracias a AMX, el rendimiento de Xeon Platinum 8490H fue fenomenal tanto generacionalmente sobre Ice Lake como en comparación con AMD EPYC. El rendimiento de OpenVINO en Sapphire Rapids fue absolutamente dominante.

Si bien el precio de $ 17,000 vino con algo de sorpresa en comparación con los precios de la serie AMD EPYC 9004 y los precios anteriores de Xeon Scalable”Ice Lake”, al menos en las cargas de trabajo de IA con AMX y otras cargas de trabajo capaces de aprovechar las nuevas características de Sapphire Rapids, el precio en realidad puede estar justificado.

El rendimiento del Xeon Platinum 8490H no solo superaba a todo lo demás, sino que la latencia era mucho más baja que bien.

Tanto el EPYC 9654 como el Xeon Platinum 8490H consumían alrededor de 325 vatios en promedio, pero el 8490H alcanzó un máximo de 377 vatios en comparación con los 360 vatios del buque insignia de Génova.

En un gama de modelos con OpenVINO, la mejora del rendimiento de Ice Lake fue fenomenal y superó a Génova para este importante software de IA de código abierto.

El”peor de los casos”con los puntos de referencia de OpenVINO fue que algunos modelos encontraron el Xeon Platinum 8490H ofrece solo un rendimiento similar en configuración 2P ns al EPYC 9554~9654. Pero algunos de estos modelos tampoco se escalaron tan bien, ya que a veces el 9554 tenía una ligera ventaja sobre el 9654.

Estos puntos de referencia se realizaron con OpenVINO 2022.2.dev dado que era el último al comenzar mi ronda del cuarto trimestre de evaluación comparativa de la CPU del servidor, mientras que desde entonces incorporé OpenVINO 2022.3 que tiene más optimizaciones y aparecerá en las evaluaciones comparativas de la CPU de Sapphire Rapids de seguimiento.

En general, el Xeon Platinum 8490H funcionó muy bien con El kit de herramientas OpenVINO AI de Intel, pero también pasemos a otras cargas de trabajo, ya que no todo está relacionado con la IA todavía.

GROMACS sigue siendo un punto de referencia de CPU interesante para HPC, incluso con un back-API + SYCL. termine ahora para que pueda disfrutar de un rendimiento aún mayor con los gustos de Intel’s Data Center GPU Max Series. Al observar el aumento aquí de EPYC 7763 a EPYC 7773X, GROMACS ha sido una de las cargas de trabajo del mundo real que se beneficia mucho del caché más grande y, por lo tanto, también debería ser un objetivo interesante para las SKU de Sapphire Rapids con memoria HBM2e. En cuanto al Xeon Platinum 8490H, su rendimiento fue mucho mejor generacionalmente que el Xeon Platinum 8380, aunque no alcanzó a los procesadores EPYC 9554 de 64 núcleos y EPYC 9654 de 96 núcleos. Pasar del Xeon Platinum 8380 de doble socket al Xeon Platinum 8490H de doble socket fue 1,67 veces mayor que el rendimiento, o un solo 8490H ofreció aproximadamente el mismo rendimiento que dos modelos 8380.

En configuraciones 1P y 2P, el Xeon Platinum 8490H consumía más energía que cualquiera de los otros procesadores probados. Un solo 8490H consumía un promedio de 315 vatios durante la prueba GROMACS con un pico de 376 vatios en comparación con el EPYC 9654 con un promedio de 267 vatios o un pico de 344 vatios para este punto de referencia. Mientras tanto, la CPU Xeon Platinum 8380 Ice Lake tenía un promedio de 250 vatios y un pico de 290 vatios.

Al calcular el rendimiento por vatio, este SKU de Sapphire Rapids estaba justo por delante de los procesadores Milan(X). pero detrás de los procesadores Génova. Al menos con respecto al Xeon Platinum 8380 hubo una mejora del 35 % con el 8490H.

Sobre una base de rendimiento por dólar a $17 000 para este SKU insignia, sale en último lugar.

Con el punto de referencia Graph500 HPC, mostró una gran mejora generacional desde Ice Lake hasta Sapphire Rapids: un solo 8490H fue 1.13x la velocidad de los procesadores duales 8380 o 1.58x la velocidad cuando se compara 1P-vs-1P generacionalmente. Si bien el Xeon Platinum 8490H ahora está muy por delante de su posicionamiento con Ice Lake, no alcanzó a los SKU de gama alta de Génova e incluso a la parte de alta frecuencia EPYC 9374F de 32 núcleos en una comparación 2P.

O al observar el TEPS máximo, el Xeon Platinum 8490H 2P estaba justo por delante del 9374F 2P pero detrás de un solo procesador EPYC 9654.

Con el punto de referencia HPCG hubo una mejora generacional del 51 % con respecto al Configuración 2P de Ice Lake a Sapphire Rapids.

Con el punto de referencia de pronóstico del tiempo WRF, el rendimiento es significativamente mejor con Sapphire Rapids sobre Ice Lake: el modelo continuo de 2,5 km se completó en un 65 % del tiempo requerido para el Ice Lake de gama alta. SKU del lago SP. Sin embargo, el rendimiento del 8490H 2P aún se quedó corto frente a los procesadores EPYC 9654/9554 e incluso al EPYC 9374F. WRF es una de las cargas de trabajo que se benefició mucho de la memoria DDR5 de 12 canales con Génova, al igual que WRF también disfrutó mucho de Milan-X. Aunque dicho esto, también será interesante ver cómo funciona el rendimiento de WRF para la serie Intel Xeon CPU Max con su memoria HBM2e.

Durante la ejecución de WRF, el Xeon Platinum 8490H promediaba un consumo de energía de 348 vatios con un registro máximo de 376 vatios.

Sapphire Rapids en muchos de estos puntos de referencia al no usar aceleradores estaba teniendo problemas para competir con Génova, pero al menos generacionalmente está mostrando una gran mejora con respecto a la tercera generación Xeon escalable”Ice Lake”. rendimiento.

A menudo, un solo Xeon Platinum 8490H se acercaba (o superaba) el rendimiento de dos procesadores Xeon Platinum 8362 o 8380.

Con algunos puntos de referencia, el EPYC 7773X con su La memoria caché grande todavía funciona muy bien en relación con Génova, pero con los SKU Sapphire Rapids HBM2e es donde estos puntos de referencia también serían muy interesantes, pero lamentablemente ninguno disponible actualmente para la prueba.

Además de la importante mejora del rendimiento generacionalmente, el rendimiento por Wa También estaba saliendo mejor con Sapphire Rapids sobre Ice Lake. Sin embargo, el Xeon Platinum 8490H consumía constantemente más potencia que los procesadores AMD Genoa.

El punto de referencia de ajedrez LC0 impulsado por IA obtuvo un gran rendimiento con el Xeon Platinum 8490H y no tuvo ningún problema para competir y superar a varios de los SKU de Génova.

Pero en términos de rendimiento por vatio, los resultados de LC0 fueron menos convincentes, pero al menos representaron una mejora significativa con respecto a Ice Lake.

La biblioteca de redes neuronales oneDNN de Intel estaba mostrando una gran mejora en el rendimiento de Ice Lake y ahora compite con los SKU de Génova de gama alta gracias a oneDNN que permite el uso de AMX con Sapphire Rapids.

La biblioteca oneDNN de Intel, a su vez, es utilizada por ONNX, OpenVINO, PaddlePaddle, PyTorch, TensorFlow, Apache MXNet y otro software de IA que, a su vez, disfrutará de un mejor rendimiento con la 4.ª generación Xeon Scalable.

Tanto generacionalmente como frente a la serie AMD EPYC 9004, el Xeon Platinum 8490H se destacó rendimiento para cargas de trabajo de IA.

Pero el consumo de energía con el Xeon Platinum 8490H superó fácilmente a los otros procesadores probados.

Cuando se trata de tareas de compilación de código que no utilizan ninguno de los aceleradores Sapphire Rapids, el Xeon Platinum 8490H fue significativamente más rápido que Ice Lake pero quedó rezagado. detrás del EPYC 9654/9554 y comúnmente incluso del SKU de alta frecuencia EPYC 9374F. Génova tiene la ventaja obvia del número de núcleos y, en el caso de las partes de alta frecuencia, tienen un reloj más alto que el 8490H para las bases de código sin tantos archivos fuente que se puedan compilar al mismo tiempo.

El Xeon Platinum 8490H podría construya el kernel Linux x86_64 y todos los módulos en 156 segundos, el mismo tiempo que el EPYC 7773X Milan-X SKU.

Para las cargas de trabajo de compilación de código, el consumo de energía del Xeon Platinum 8490H se mantuvo considerablemente más alto que los otros procesadores probados.

Sería interesante ver cómo funcionan las SKU de Sapphire Rapids con memoria HBM2e para la compilación de código, ya que puede ser un caso convincente en granjas de compilación/entornos de integración continua (CI) para simplemente ejecutar el HBM2e como memoria del sistema.

Aunque no aprovecharon por completo todos los núcleos de la CPU, los procesadores Xeon Sapphire Rapids funcionaron muy bien con las cargas de trabajo OpenJDK Java, tradicionalmente un área en la que las CPU Intel han liderado el mejor rendimiento de Java.

Para base de CPU Al igual que con el popular software Blender, el rendimiento de Sapphire Rapids es mucho más sólido gracias al mayor número de núcleos y al caché más grande, pero se queda atrás de Génova e incluso de Milan(X) en número de núcleos/subprocesos.

Los núcleos de trazado de rayos Embree de Intel vieron el rastro del Xeon Platinum 8490H 2P detrás de un solo procesador EPYC 9654.

Pero cuando se trata de la biblioteca Open Image Denoise de Intel que forma parte de su colección oneAPI, el rendimiento del Xeon Platinum 8490H impresiona.

Aunque en términos de rendimiento por vatio, los SKU de Génova de gama alta estaban mejor posicionados para esta biblioteca de eliminación de ruido.

Con el motor de trazado de rayos OSPRay de Intel que hace un uso efectivo del AVX-512, el rendimiento del Xeon Platinum 8490H coincidía con el de los procesadores EPYC 9554 de 64 núcleos. Un solo 8490H coincidía con dos procesadores 8380 y pasar de la configuración 8380 2P a 8490H 2P produjo un 75 % más de rendimiento.

El rendimiento por vatio de OSPRay para el 8490H fue menos convincente con”solo”un 37 % de mejora, pero al menos competitivo con respecto a Genoa.

Del mismo modo, el Xeon Platinum 8490H se desempeñaba de manera competitiva frente a la CPU Genoa de 64 núcleos con el software de visualización interactiva OSPRay Studio y mucho más rápido que los procesadores escalables Xeon de la generación anterior.

Para la compresión de texturas ASTC, el Xeon Platinum 8490H 2P fue 1,79 veces más rápido que su predecesor.

Para el rendimiento de Node.js, los procesadores escalables Xeon de 4.ª generación fueron mucho más rápidos generacionalmente que los de 3.ª generación y por delante ahora de Génova, al menos en lo que respecta al rendimiento de Node.js de un solo subproceso. Obviamente, Génova, con su mayor número de núcleos, podrá proporcionar un entorno Node.js más denso si se desea, pero al menos en términos de ejecución de secuencias de comandos de subproceso único, Sapphire Rapids disfrutó 1,79 veces el rendimiento de Ice Lake.

SIMDjson es otro caso de prueba interesante ya que está optimizado para AVX-512. AMD Zen 4 disfrutó de un gran impulso en el rendimiento gracias a que agregó AVX-512, mientras que ahora Sapphire Rapids se ha puesto al día con los resultados de Génova para el análisis rápido de JSON si tiene Gigabytes de datos para alimentarlo por segundo.

Para aquellos que confían en una gran cantidad de secuencias de comandos de Python en su servidor, el rendimiento de ejecución de Python de un solo subproceso disfrutó de algunas mejoras agradables de Ice Lake a Sapphire Rapids que ahora lo pone en línea con EPYC de 4.ª generación de AMD.

Los procesadores escalables Intel Xeon también tienen una larga tradición de buen desempeño para las cargas de trabajo del servidor web PHP/

Para el programa CAD de código abierto BRL-CAD de subprocesos múltiples, el Xeon Platinum 8490 logró salir adelante de el EPYC 9554, en configuraciones 1P y 2P, respectivamente, pero se quedó atrás del modelo insignia EPYC 9654.

La biblioteca de procesamiento de señal digital de código abierto Liquid-DSP vio más del doble de rendimiento al pasar desde el buque insignia Ice Lake hasta los procesadores Sapphire Rapids.

Fue un fin de semana ajetreado de pruebas comparativas g con finalmente tener en mis manos Sapphire Rapids.

El Xeon Platinum 8490H disfrutaba de un rendimiento mucho mejor sobre Ice Lake con el software de dinámica de fluidos computacional (CFD) OpenFOAM 10. Aunque aquí el Xeon Platinum 8490H solo estaba justo detrás del rendimiento del EPYC 9374F y el EPYC 7773X Milan-X también funciona muy bien aquí con su gran caché. Nuevamente, una carga de trabajo que debería ser bastante interesante para ejecutarse en la serie Intel Xeon CPU Max, ya que 64 GB de HBM2e deberían ayudar mucho con este software CFD de código abierto líder.

El Xeon Platinum 8490H continuó consumiendo significativamente más potencia que los otros procesadores probados.

Bueno, fueron cuatro días muy ocupados de evaluación comparativa de Sapphire Rapids y solo tocó la punta del iceberg cuando se trata de explorar el potencial de rendimiento de Sapphire Rapids en torno a AMX y el aceleradores Debido al muy poco tiempo que llevo en mis manos este servidor Xeon Platinum 8490H hasta el momento, permanezca atento a más puntos de referencia y analice más de cerca varios paquetes de software optimizados/ajustados para hacer uso de toda la funcionalidad escalable de 4.ª generación Xeon en las próximas semanas.. Además de ver qué tan bien se desempeña Sapphire Rapids con la plataforma Clear Linux ampliamente ajustada de Intel, varios puntos de referencia del compilador y todas las pruebas de seguimiento habituales que tiendo a hacer con cada nueva generación importante de CPU.

De los puntos de referencia llevado a cabo a tiempo para el día del lanzamiento, al tomar la media geométrica de todas las pruebas de”creador”, el Xeon Platinum 8490H logró salir justo por delante del EPYC 9554 al observar el rendimiento de doble socket. El EPYC 9554 tiene 64 núcleos frente a los 60 núcleos del Xeon Platinum 8940H, mientras que la parte AMD Genoa cuesta un poco más de $ 9k frente al precio de $ 17k del 8940H. En estas cargas de trabajo de creadores, el Xeon Platinum 8940H 2P tuvo un rendimiento 2,16 veces superior al del procesador Xeon Platinum 8380 2P Ice Lake. Contando como cargas de trabajo de”creador”se contaron OSPRay, OSPRay Studio, C-Ray, Tachyon, POV-Ray, Blender, GraphicsMagick, Embree, oneDNN, OIDN, OpenVINO, ASTC Encoder, compilación de Godot temporizada y BRL-CAD.

Al tomar la media geométrica de todos los puntos de referencia de computación de alto rendimiento (HPC) convencionales para esta comparación del día del lanzamiento, el Xeon Platinum 8490H también coincidió efectivamente con el EPYC 9554 2P. Aquí, el 8940H 2P disfrutó 2,27 veces el rendimiento del 8380 2P. Un solo Xeon Platinum 8490H también logró ofrecer 1,28 veces el rendimiento de dos procesadores Xeon Platinum 8380 en estos puntos de referencia de HPC. Los puntos de referencia de HPC para lo que se ejecutó a tiempo para el día del lanzamiento incluyeron NPB, Rodinia, HPCG, MT-DGEMM, AMG, NAMD, GROMACS, LULESH, Pennant, Incompact3D, OpenFOAM, RELION, oneDNN, OpenVINO, LCzero, WRF y Graph500.

Es con los puntos de referencia de aprendizaje automático como oneDNN y OpenVINO con AMX donde el Xeon Platinum 8490H dominó entre los puntos de referencia realizados para el lanzamiento de Sapphire Rapids. Con la media geométrica de los puntos de referencia de aprendizaje automático, el Xeon Platinum 8490H disfrutó de más de 3 veces el rendimiento del Xeon Platinum 8380 y donde el Xeon Platinum 8490H pudo superar fácilmente a los procesadores EPYC 9654 y EPYC 9554. Sí, en los puntos de referencia de seguimiento también habrá más puntos de referencia que analicen el rendimiento de la IA en otros paquetes de software y una exploración más detallada de alternar AMX, etc.

Sin sorpresa, el software que es parte de la colección oneAPI de Intel o Aprovechar la amplia cartera de software de código abierto de Intel está en buena forma para Sapphire Rapids y los nuevos productos de la serie Max.

Pero para tareas de software como la compilación de código o la representación 3D basada en CPU, donde el número absoluto de núcleos/hilos es más apremiantes y/o con un uso intensivo del ancho de banda de la memoria donde brilla la memoria de 12 canales, las piezas de AMD Genoa lideran fácilmente.

El rendimiento de Sapphire Rapids coincidió con los SKU de propósito general de AMD EPYC Genoa en lo que respecta al rendimiento de ejecución de Python como así como otros puntos de referencia de lenguaje de secuencias de comandos comunes.

Al tomar la media geométrica de los más de 100 puntos de referencia que ejecuté a tiempo para el día del lanzamiento, el Xeon Platinum 8490H 2P se ubicó entre los SKU EPYC 9374F y EPYC 9554 2P en general. The benchmarks I completed in time for launch day can be viewed here. En la amplia gama de pruebas realizadas, el Xeon Platinum 8490 ofrecía un rendimiento de 1,79 a 1,83 veces superior al del procesador Xeon Platinum 8380 Ice Lake de la generación anterior. Un solo Xeon Platinum 8490H solía superar a los dos procesadores Xeon Platinum 8380 y Xeon Platinum 8362. Mientras tanto, el procesador insignia AMD EPYC 9654″Genoa”fue alrededor de un 16 % más rápido que la configuración Xeon Platinum 8940H 2P, mientras que el EPYC 9554 2P de 64 núcleos fue un 9 % más rápido.

Por último, un vistazo a la potencia de la CPU consumo en todos los puntos de referencia ejecutados para este artículo. El Xeon Platinum 8490H, tanto en configuraciones de zócalo simple como dual, consumía significativamente más energía que las CPU Ice Lake de la generación anterior e incluso que las SKU de EPYC Genoa. En todas las evaluaciones comparativas, se observó un promedio de 303 vatios y un consumo máximo de energía de 379 vatios, según lo expuesto a través de las interfaces RAPL sysfs. Mientras tanto, el Xeon Platinum 8380 tuvo un promedio de 223 vatios y un pico de 293 vatios en el conjunto de puntos de referencia, mientras que el EPYC 9654 también tuvo un promedio de 223 vatios con un pico de 363 vatios.

El Xeon Platinum 8940H dominó por completo en los puntos de referencia de IA con oneDNN, DeepSparse y OpenVINO capaces de aprovechar al máximo las capacidades de Sapphire Rapids con AMX. También hubo demostraciones muy sólidas de los procesadores Xeon de 4.ª generación con Open Image Denoise para eliminación de ruido de imágenes y OSPRay, GraphicsMagick, Python, PHP, OpenJDK Java, etc. cargas de trabajo de servidor que escalan bien a un alto número de subprocesos donde EPYC 9654 de 96 núcleos/192 subprocesos podría beneficiarse, incluso en configuraciones 2P de hasta 384 subprocesos. Algunas de las cargas de trabajo con uso intensivo de memoria también funcionaron mejor gracias a AMD EPYC”Genoa”que admite 12 canales de memoria DDR5, pero para esas mismas cargas de trabajo también es donde la serie Intel Xeon CPU Max con HBM2e también debería funcionar muy bien. Desafortunadamente, todavía no hay acceso práctico a los SKU de Sapphire Rapids HBM2e para la evaluación comparativa allí.

Durante las próximas semanas también habrá evaluaciones comparativas en estos procesadores que buscan más cargas de trabajo capaces de aprovechar los diferentes aceleradores nuevos en Rápidos Zafiro. Los nuevos aceleradores tienen mucho potencial, pero llevará tiempo que el ecosistema de software se ponga al día para adoptarlos. Al menos, aunque el soporte del controlador del kernel está en orden para Linux 5.19+ y ahora hasta el software de espacio de usuario de Linux para ponerse al día. Dado que se espera que Sapphire Rapids esté disponible pronto en las nubes públicas, eso debería ayudar a permitir que más desarrolladores prueben 4th Gen Xeon Scalable e, idealmente, comiencen a adaptar su software para aprovechar los aceleradores. Desafortunadamente para las SKU de Xeon Sapphire Rapids de gama baja, los aceleradores están limitados o completamente desactivados a menos que se utilice el modelo de licencia Intel On Demand. Serán unos meses interesantes por delante para ver cómo se desarrolla todo y observar la adopción de software para el soporte del acelerador al igual que observo de cerca las otras áreas de desarrollo de Linux.

El precio de 4th Gen Xeon Scalable en Podría decirse que el precio máximo de $17,000 para el Xeon Platinum 8490H es un poco elevado, a menos que todas sus cargas de trabajo puedan hacer un uso óptimo de los aceleradores y las nuevas capacidades de Sapphire Rapids. Mientras tanto, el AMD EPYC 9654 tiene un precio de lista de $ 11,805 que, incluso cuando se tienen en cuenta los costos, si se opta por 12 DIMM por zócalo en lugar de 8 DIMM si se desea llenar todos los canales de memoria disponibles, aún saldrá por delante del precio de 8940H.

El precio de la serie Max de CPU Xeon optimizada para HPC de Intel en realidad está en mejor forma si no planea hacer uso de los aceleradores además de DSA. La Xeon CPU Max Series 9480 tiene 56 núcleos y la misma frecuencia base/turbo que la 8490H, los mismos 112,5 MB de caché, la misma calificación TDP de 350 vatios, ocho canales de DDR5-4800 y 4 dispositivos DSA pero sin QAT/DLB/IAA aceleradores Ese 9480 tiene un precio de $ 12,980 USD mucho más cercano al EPYC 9654, mientras que los 64 GB de HBM2e deberían ser extremadamente interesantes para los puntos de referencia de HPC. Si puede arreglárselas solo con 64 GB de HBM2e como memoria del sistema, el precio es extremadamente favorable para aquellas SKU optimizadas para HPC que ejecutan el modo solo HBM y no necesitan lidiar con costosos módulos DIMM DDR5. Como hemos visto en la gran mejora con el EPYC 7773X por su caché más grande, incluso esos 768 MB de caché L3 por socket fueron suficientes para proporcionar ventajas significativas en mis cargas de trabajo del mundo real. Tener velocidades HBM2e como memoria del sistema debería impresionar para cargas de trabajo como OpenFOAM, NWChem, WRF y otras. El modo exclusivo de HBM para Xeon CPU Max Series es interesante, aunque con el 9480 con poco más de 1 GB de RAM por núcleo no será suficiente para muchas cargas de trabajo MPI modernas, pero los modos plano/caché de HBM pueden venir al rescate. En cualquier caso, esta es la línea de servidores más emocionante de Intel en muchos años y con muchas características nuevas importantes que solo verán resultados más positivos a medida que el software se adapte para hacer uso de estas nuevas capacidades.

Categories: IT Info