EPYC 9654 es el nuevo procesador insignia de AMD con 96 núcleos deportivos/192 subprocesos, un Reloj base de 2,4 GHz con reloj de refuerzo de 3,7 GHz y tiene un TDP de 360 ​​vatios. El TDP configurable en esta única pieza de 96 núcleos es de 320 a 400 vatios.

Mientras tanto, la EPYC 9554 es la pieza de 64 núcleos de nivel superior de AMD sobre la EPYC 9534. La EPYC El 9554 tiene 64 núcleos/128 subprocesos con un reloj base de 3,1 GHz y un reloj boost de 3,75 GHz, mientras que tiene un TDP de 360 ​​W como el EPYC 9654. Al igual que el EPYC 9654, el cTDP se puede ajustar de 320 a 400 W. El actual procesador insignia de Milán, el EPYC 7763, como recordatorio, tiene 64 núcleos/128 subprocesos con un reloj base de 2,45 GHz y un reloj de impulso máximo de 3,5 GHz. O en el lado de Milan-X está el EPYC 7773X con un reloj base de 2,2 GHz y un reloj de impulso máximo de 3,5 GHz mientras tiene 768 MB de caché L3.

El AMD EPYC 9374F 32 La parte de alta frecuencia del núcleo que aparece en su revisión separada tiene un reloj base de 4,05 GHz y un aumento de 4,3 GHz mientras tiene un TDP de 320 vatios.

El EPYC 9654 tiene un con un precio de lanzamiento de alrededor de $11 805, el EPYC 9554 se venderá al por menor por alrededor de $9087 USD y el EPYC 9374F por alrededor de $4850.

Una comparación de tamaño de AMD Milan SP3 sobre AMD Genoa SP5.

AMD proporcionó amablemente la plataforma de referencia Titanite y los procesadores EPYC 9004 Genoa para esta revisión y evaluación comparativa de Linux. Para la revisión del lanzamiento de hoy, los procesadores de servidor probados incluyeron:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Todos estos procesadores fueron recientemente probados/re-probados usando Ubuntu 22.10 con el kernel Linux 6.0 y GCC 12. Más detalles sobre la pila de software a continuación.

Para los nuevos procesadores EPYC Genoa, probé los EPYC 9554 y 9654 tanto en el modo determinista de”rendimiento”predeterminado como en el BIOS cambia al modo de determinismo de”potencia”para aquellos curiosos sobre el impacto general en el rendimiento del control de determinismo del BIOS. Los resultados de Génova con el sufijo”-Potencia”son cuando se ejecuta en el modo de determinismo de potencia sobre el determinismo de rendimiento predeterminado. Todas las demás configuraciones del BIOS para cada uno de los procesadores Intel/AMD probados tenían sus respectivos valores predeterminados. Se llevaron a cabo pruebas 1P y 2P en todos los procesadores probados disponibles.

Dado mi”vanguardia”habitual y mi enfoque prospectivo, se llevaron a cabo todos estos puntos de referencia de Ubuntu 22.10 con su compilador estándar GCC 12.2. Para una apariencia fresca del núcleo, se utilizó Linux 6.0. Esta misma pila de software se usó en todos los servidores/procesadores probados. Cada una de las configuraciones se ejecutaba con la memoria a su máxima velocidad nominal y configuración de canales de memoria. Todas las CPU se probaron utilizando el regulador de escalado de frecuencia de CPU de”rendimiento”.

Ubuntu 22.04 LTS también está en buena forma para EPYC Genoa y he realizado pruebas de estos procesadores de la serie EPYC 9004 en Ubuntu 22.04 con su kernel Linux 5.15, pero para mi análisis del rendimiento de Linux de cara al futuro y con el deseo de utilizar el software original más reciente, esta ronda de evaluación comparativa se realizó con Ubuntu 22.10 + Linux 6.0 en todos los procesadores de servidor probados.

Para sorpresa de nadie, el soporte del procesador AMD EPYC 9004″Genoa”para Linux está en buenas condiciones para el lanzamiento. El uso de una distribución con una versión reciente del kernel de Linux (o una distribución empresarial de Linux con sus kernels actualizados/revisados) debería ser una buena forma para estos procesadores de servidor Zen 4. Hay algunas características que llegaron recientemente, como el manejo actualizado de Last Branch Record, pero todas las funciones clave ya están implementadas, incluida la supervisión de la temperatura y el consumo de energía. En el lado del compilador, el soporte de Zen 4 (znver4) está retrasado. AMD publicó recientemente su parche de habilitación inicial de Znver4 mientras trasladaba las tablas de costos de Znver3. Ese soporte inicial se encontrará en GCC 13 que saldrá en los primeros meses del próximo año y el soporte LLVM/Clang 16.0 está pendiente. Se espera que AMD publique pronto una nueva versión de AOCC para su compilador AMD Optimizing C/C++ con optimizaciones de Zen 4.

Durante la evaluación comparativa, se llevó a cabo una amplia selección de evaluaciones comparativas de servidor/HPC, al mismo tiempo que se monitoreaba la potencia de la CPU. consumo de las interfaces RAPL expuestas y proporciona métricas de rendimiento por vatio por punto de referencia y más.

Inmediatamente después de activar algunos puntos de referencia de HPC, los procesadores AMD EPYC Genoa muestran su destreza para el rendimiento. AMD EPYC 9654 2P tuvo un 40 % menos de tiempo de ejecución para el código GPAW DFT en comparación con EPYC 7773X Milan-X y se acercaba al punto de ser casi el doble de rápido que los procesadores EPYC 7763. Al cambiar al modo de determinismo de potencia, se extrajo más rendimiento de los procesadores EPYC Genoa. Simplemente no son los 96 núcleos frente a los 64 núcleos lo que lleva a la gran mejora con Génova, ya que el rendimiento EPYC 9554 1P2P de 64 núcleos también fue estelar: ¡EPYC 9554 igualó el rendimiento EPYC 7763 2P para GPAW!

Pero Por supuesto, estos nuevos procesadores EPYC 9554/9654 consumen más energía que sus predecesores, como era de esperar.

En términos de rendimiento por dólar, los nuevos procesadores EPYC 9554/9654 funcionan bastante bien contra las piezas de la generación anterior. Por supuesto, ese es solo el precio de la CPU, pero también hay que considerar el precio de la memoria DDR5 y el precio de la plataforma, pero no fue posible obtener evaluaciones precisas allí antes del lanzamiento para ver cómo se compararán los precios de la placa base de Génova, etc. a Milán (X).

El rendimiento de AMD EPYC 9654 y EPYC 9554 fue igualmente estelar con el punto de referencia de dinámica molecular GROMACS. El rendimiento de EPYC 9654 2P fue 1,66 veces superior a la velocidad de EPYC 7773X 2P y la configuración de EPYC 9654 1P casi igualó el rendimiento de EPYC 7773X 2P… Hay una mejora sustancial gracias a los núcleos adicionales, la memoria del sistema DDR5, 12 canales de memoria, AVX-512 y otras mejoras arquitectónicas de Zen 4. Y si se ejecuta en modo de determinismo de potencia, rendimiento aún mayor.

Si bien el consumo de energía de EPYC Genoa fue mayor que con EPYC Milan(X) y Xeon Ice Lake, en términos de rendimiento por vatio para GROMACS, el la eficiencia se encuentra con Génova. Los procesadores insignia de Intel Xeon Platinum 8380 simplemente no eran competitivos con Genoa y tuvieron bastantes dificultades para competir contra Milan(X) en la mayoría de los puntos de referencia, pero al menos Xeon Sapphire Rapids llegará el próximo trimestre.

El rendimiento por Las métricas en dólares basadas en el precio de la CPU ponen a Genoa en buena forma.

Los procesadores EPYC Genoa probados funcionaron de manera increíble con NAMD y brindaron excelentes resultados generacionales desde Milan/Milan-X y ampliaron la ventaja sobre la generación actual Procesadores Xeon Ice Lake.

AMD EPYC Genoa se desempeñó de manera excelente con el benchmark Graph500.

Los resultados de EPYC 9654/9554 también fueron asombrosos para el benchmark HPCG. En pocas palabras, la serie AMD EPYC 9004 a través de una amplia variedad de puntos de referencia ofreció constantemente una mejora de rendimiento sin precedentes.

Los procesadores EPYC 9554 y EPYC 9654 exhibieron un rendimiento fenomenal con el pronóstico del tiempo usando WRF. La mejora no solo del EPYC 7773X/7763 al EPYC 9654 fue asombrosa, sino que incluso el EPYC 9554 de 64 núcleos fue una gran ventaja gracias al AVX-512 y otras mejoras con respecto a los procesadores de servidor Zen 3 anteriores.

Activado En términos de rendimiento por dólar con WRF, los procesadores EPYC Genoa continuaron brillando.

Con RELION, la mejora generacional fue menor pero aún significativa desde Milán (X) hasta Génova.

AMG fue uno de los pocos puntos de referencia en los que los procesadores Xeon Platinum 8362/8380 Ice Lake pudieron adelantarse a los procesadores emblemáticos EPYC Milan, pero ese ya no era el caso con Genoa.

Aunque tiene un mayor consumo de energía, el EPYC Los procesadores Genoa brindaban una gran eficiencia energética.

En una amplia gama de puntos de referencia de HPC, el rendimiento del procesador EPYC Genoa ha sido simplemente fenomenal. Las últimas semanas de ejecución de EPYC Genoa han sido algunos de los resultados de referencia de rendimiento más convincentes que he visto en los últimos 18 años o más con la increíble mejora generacional sin dejar de ofrecer valor y eficiencia energética líderes.

Across una amplia variedad de puntos de referencia de HPC, las configuraciones EPYC 9654 y 9554 ofrecían un rendimiento excelente en el modo de determinismo de rendimiento predeterminado.

OpenVINO para el proyecto de software de IA de código abierto de Intel estaba funcionando excelente en AMD EPYC 9004″Genoa Procesadores con AVX-512. Los procesadores Xeon Platinum 8362/8380 brindaron un mejor rendimiento que las CPU Milan/Milan-X gracias a AVX-512, pero la implementación eficiente de AVX-512 de Genoa llevó a un rendimiento mucho mayor ahora con OpenVINO.

La mejora con OpenVINO para Génova es tan espectacular que el valor de rendimiento por dólar supera con creces el de las CPU Intel/AMD existentes.

OpenVINO fue un bastión para Intel Xeon Scalable”Ice Lake”en Milán/Milán-X pero el procesador EPYC 9554″Genoa”puede incluso competir con dos procesadores Xeon Platinum 8380. El rendimiento de Génova es una locura.

En los muchos modelos diferentes probados, OpenVINO 2022 tuvo un rendimiento excelente con los procesadores EPYC Génova gracias a la compatibilidad con AVX-512. Si bien inicialmente me preocupaba la implementación de AVX-512 de Zen 4 con una ruta de datos de 256 bits, se ha demostrado que funciona muy bien y sin las implicaciones energéticas/térmicas de AVX-512 en las CPU Intel anteriores.

Los procesadores EPYC Genoa también funcionaron muy bien con la biblioteca de red neuronal profunda oneDNN de Intel que puede hacer un uso extensivo de AVX-512.

Incluso para trabajos”simples”como la compilación de código en múltiples trabajos para saturar el CPU, el rendimiento de la serie AMD EPYC 9004 aún brindaba mejoras generacionales considerables con respecto a Milán.

La ventaja de recuento de núcleos con AMD EPYC también ayuda y es un área en la que EPYC Genoa seguirá liderando sobre los próximos procesadores Sapphire Rapids de Intel.

¡Los nuevos procesadores Genoa de gama alta pueden compilar una compilación del kernel Linux x86_64 predeterminada en menos de 20 segundos!

O puede crear un kernel completo con todos los módulos del kernel disponibles en menos de 20 segundos. dos minutos.

Sobre una base de rendimiento por dólar, el resultado de EPYC Génova s eran comparables al precio actual de Milán por valor si está interesado en una granja de compilación de código/servidor CI.

Para granjas de procesamiento basadas en CPU, AMD EPYC Genoa con hasta 96 núcleos y las mejoras de diseño sobre Zen 3 estaban dando sus frutos con mejoras significativas en el tiempo de renderizado. Con la conocida escena de BMW, ¡el procesador estrella EPYC 9654 2P podía renderizarlo en tan solo 8 segundos!

AMD EPYC Genoa estaba funcionando muy bien con Blender 3.3 con grandes mejoras generacionales y un rendimiento mucho mejor que lo que puede se puede lograr con Xeon Scalable Ice Lake y su cantidad de núcleos mucho más baja.

El modo de determinismo de energía puede ayudar con los tiempos de procesamiento de Blender aún más, si no le importa el aumento de energía/impacto térmico.

Desde el punto de vista del rendimiento por dólar, las nuevas CPU de Génova son muy comparables en cuanto a precio a las de Milán al menos sobre la base de la CPU.

Los núcleos de trazado de rayos Embree de Intel pueden beneficiarse significativamente de Génova con AVX-512. El EPYC 9654 2P en modo determinismo de energía tenía el doble de velocidad que el procesador AMD EPYC 7773X 2P.

Si bien estos procesadores Genoa probados tienen un consumo de energía más alto que el Milán, en términos de rendimiento por vatio, lo estaban haciendo mucho mejor que las otras CPU Intel/AMD.

Genoa estaba funcionando bien en los otros componentes de software Intel optimizados para AVX-512 que forman parte de su colección oneAPI.

El rayo OSPRay-El motor de seguimiento tuvo algunas victorias con los procesadores Xeon Platinum 8380/8662 sobre Milan/Milan-X, pero ese ya no es el caso con Génova. Dado que OSPRay está bien optimizado por Intel para el uso de AVX-512 en sus CPU Xeon, funciona igual de bien con los nuevos procesadores de servidor AVX-512 de AMD.

Para las cargas de trabajo de renderizado basadas en CPU, los resultados de Genoa fueron fantásticos, especialmente en casos como un solo EPYC 9654 capaz de superar las configuraciones 2P EPYC 7773X o 2P 7763.

En un punto de referencia de Node.js de un solo subproceso, Genoa ahora pudo salir adelante de Ice Lake gracias a la Mejoras en la arquitectura de Zen 4.

El punto de referencia de análisis JSON de simdjson normalmente no es interesante para el rendimiento de servidores grandes, pero ahora simdjson tiene una ruta optimizada AVX-512. Los procesadores de la serie EPYC 9004 estaban muy por delante de Ice Lake ahora gracias a la compatibilidad con Zen 4 AVX-512.

El consumo de energía también era comparable al de Ice Lake, ya que las CPU no estaban completamente saturadas para el análisis comparativo de JSON.

EPYC 9554 ofrecía el mejor rendimiento por vatio para esta prueba de análisis compatible con AVX-512 para gigabytes de datos JSON.

Las pruebas de rendimiento de Python de subproceso único también mostró los buenos avances con Zen 4.

Y algunas mejoras muy buenas para Numpy.

El rendimiento de PHP de subproceso único de Génova estaba ahora en un estado solo comparable al de Ice Lake , pero para un servidor web completamente cargado, por supuesto, se puede encontrar más capacidad con Genoa y su mayor cantidad de núcleos/hilos.

En cargas de trabajo más comunes como la compresión de archivos/datos, Zen 4 con Genoa ofrece algunas mejoras incrementales agradables con respecto a Zen 3.

Génova obtuvo algunas ganancias estelares con BRL-CAD.

Hubo una mejora generacional significativa para disfrutar y con Genoa para el software de procesamiento de señal digital de código abierto Liquid-DSP.

Para resumir, de alrededor de 200 pruebas comparativas diferentes que realicé, los procesadores AMD EPYC 9654 y EPYC 9554 fueron un éxito rotundo. Ofrecieron un excelente impulso generacional en general, pero especialmente en las muchas cargas de trabajo de servidor/HPC capaces de aprovechar AVX-512 y, a su vez, ampliaron la ventaja de AMD sobre los procesadores Xeon Scalable”Ice Lake”actuales.

Los resultados de OpenFOAM con EPYC Génova fue fantástico para la dinámica de fluidos computacional (CFD) de código abierto.

OpenRadioss de Altair también se ve muy bien en Génova. (No todas las CPU se probaron aquí debido a que se agregó ese nuevo punto de referencia tarde en el ciclo de revisión de pruebas. Pero dado el interés de este nuevo proyecto de código abierto de Altrair, estos son los puntos de referencia para las CPU probadas).

Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.

Above is un vistazo al consumo de energía combinado observado para todas las configuraciones de procesador bajo prueba durante toda la duración de los puntos de referencia realizados. Nuevamente, todas las medidas de potencia de la CPU provienen de las interfaces RAPL expuestas en Linux. El EPYC 9554 en su modo predeterminado (determinismo de rendimiento) tenía un consumo de energía promedio de 221 Watts con un pico de 355 Watts, en comparación con el EPYC 7763 con un promedio de 170 Watts y un pico de 286 Watts, pero al habilitar el modo de determinismo de energía, saltó a un promedio de 234 vatios con un pico de 404 vatios. Mientras tanto, el buque insignia EPYC 9654 de 96 núcleos tenía un consumo de energía promedio de 223 Watts y un pico de 363 Watts, o un promedio de 256 Watts en el modo de determinismo de energía y un pico allí de 415 Watts. En el modo EPYC 9654 2P eso fue un promedio de 366 Watts y un pico de 697 Watts o en el modo determinismo de potencia un promedio de 443 Watts y un pico de 833 Watts. El consumo de energía es mayor con estos nuevos procesadores Socket SP5 pero, como lo muestran muchas de las métricas de rendimiento por vatio, cuando se trata de la eficiencia energética, a menudo está por delante de AMD EPYC 7003″Milán”o, en el peor de los casos, el rendimiento fue más o menos similar. por vatio a las piezas de la generación anterior. Por lo tanto, los aumentos de potencia están justificados y también hay procesadores EPYC 9004″Genoa”más bajos si no se quiere entrar en el rango de 300 ~ 400 vatios.

Al tomar la media geométrica de todos los puntos de referencia que se ejecutaron con éxito en todos los procesadores, así es como se dan las cosas. Incluso un solo EPYC 9554 supera a la configuración 2P EPYC 7773X en general… AMD 4th Gen EPYC es excelente con su implementación AVX-512, memoria del sistema DDR5, doce canales de memoria y otras mejoras arquitectónicas de Zen 4. El EPYC 9554 2P de 64 núcleos fue un 64 % más rápido que la configuración general del EPYC 7763 2P de 64 núcleos, o un 67 % si se ejecutaba el EPYC 9554 2P en el modo de determinismo de potencia. Mientras tanto, el buque insignia EPYC 9654 2P fue un 74 % más rápido que el EPYC 7763 2P o que subió hasta un 85 % cuando las CPU insignia de Génova se ejecutaban en el modo de determinismo de potencia. AMD EPYC 9654 2P funcionaba a más del doble de la velocidad del buque insignia actual de Intel, los procesadores”Ice Lake”Xeon Scalable 8380 2P.

El ascenso generacional de Milán a Génova fue increíble en la amplia gama de evaluaciones comparativas de servidores y HPC que he llevado a cabo. Ahora me queda soñar despierto sobre cómo se verá Genoa-X el próximo año sabiendo que todavía hay más potencial para exprimir Zen 4 en el lado del servidor, así como las CPU de Bergamo del próximo año para hasta 128 núcleos para centrarse en la nube cargas de trabajo informáticas.

Como ya he demostrado mucho en el lado del escritorio de la serie Ryzen 7000, la implementación AVX-512 de AMD Zen 4 es notablemente eficiente y eso es aún más cierto en el lado del servidor. Con cargas de trabajo aún más relevantes aquí que pueden hacer uso de AVX-512 y algunas mejoras sorprendentes como se muestra a lo largo de estos puntos de referencia.

Sobre una base de precios de CPU, la serie EPYC 9004 es competitiva con la EPYC 7003 existente”Procesadores Milan(X)”y procesadores Xeon Scalable Ice Lake. Sin embargo, la transición a Génova también implica la necesidad de una memoria de sistema DDR5 ECC que es más costosa que DDR4. Todavía no he recibido ninguna información de precios avanzada sobre ninguna placa base EPYC Genoa minorista, por lo que no estoy seguro de cómo se desarrollará, pero presumiblemente con el Socket SP5 más complejo y los requisitos de mayor potencia, tendrá un precio relativo más alto para lo que hemos visto con las placas base EPYC SP3. Los procesadores EPYC Milan seguirán estando disponibles para aquellos que buscan servidores de menor precio pero con un rendimiento aún muy saludable.

En el lado del soporte de Linux, el kernel de Linux ascendente y otras claves los componentes están en buena forma para el soporte en el lanzamiento con la serie EPYC 9004… De acuerdo, eso es más bien un hecho con la cuota de mercado actual de servidores Linux. Pero todavía hay espacio para que AMD avance en su compatibilidad con Linux/código abierto. Por ejemplo, AMD se retrasó con sus parches IBRS automáticos para el kernel de Linux y solo los publicó la semana pasada. También es solo con Linux 6.1 donde el caché a caché de la CPU AMD y los informes de memoria con perf están aterrizando, para aquellos interesados ​​​​en esas capacidades de creación de perfiles ampliadas. Además, solo con Linux 6.1 se estrena la funcionalidad LbrExtV2 Last Branch Record, nueva en Zen 4. Mientras tanto, Linux 6.0 eliminó AMD X2AVIC para máquinas virtuales KVM. Todavía por integrarse en el kernel de Linux, pero disponible en forma de parche, está el soporte de QoS en torno a la asignación lenta de ancho de banda de memoria con memoria CXL y la configuración de eventos de monitoreo de ancho de banda (BMEC). Por lo tanto, hay algunas características no críticas que han llegado tarde al núcleo principal de Linux, pero al menos en términos de todo el soporte clave, está en buena forma para el lanzamiento. Por supuesto, una vez que las características llegan a la línea principal, también existe el tiempo adicional antes de encontrar estos kernels en uso por varias distribuciones de Linux o retroportados a las versiones de kernel empresarial para RHEL y SLES. En una nota positiva, la línea de tendencia ascendente de Linux de AMD para el tiempo de prelanzamiento ha mejorado para las generaciones sucesivas de procesadores EPYC/Zen (en gran parte porque han estado contratando a muchos más ingenieros de Linux en los últimos dos años).

Todavía existe el ángulo desafortunado de compatibilidad de ajuste de compilador posiblemente tardía para esta nueva generación de procesadores. Fue solo a mediados de octubre cuando AMD envió su compatibilidad con el compilador Znver4 para GCC que agregó el objetivo”-march=znver4″y luego se fusionó con GCC 13 Git a fines de octubre. Pero con este soporte inicial, se transfiere la tabla de costos/ajustes de Znver3; el ajuste de Znver4 se espera”más tarde”. Con suerte, el soporte optimizado todavía llegará a tiempo para GCC 13, que a su vez debería ver su lanzamiento estable como GCC 13.1 alrededor de marzo o abril del próximo año. Pero no será hasta la mayoría de los lanzamientos de distribución de Linux H2’2023 como Ubuntu 23.10, donde GCC 13 se usa como el compilador del sistema predeterminado. Si AMD hubiera incluido su compatibilidad con Znver4 en GCC mucho antes del lanzamiento (como Intel es conocido y habiendo ajustado gran parte de su habilitación Sapphire Rapids y AMX para GCC 12), ya podría estar disponible en Ubuntu 22.04 LTS y otras distribuciones recientes. También hay un parche Znver4 para GNU Binutils que se encuentra en la lista de correo y al momento de escribir este artículo aún no se ha fusionado.

O dicho de otra manera, en el lanzamiento anual del compilador GCC 13 donde AMD está Solo debutando su soporte Zen 4, Intel ya ha trabajado y fusionado para soporte GCC 13 para varios procesadores 2023 ~ 2024. GCC 13 ya ha puesto en cola Grand Ridge y Granite Rapids, Meteor Lake, Sierra Forest, y eso incluyó habilitar varias instrucciones nuevas que vienen con esos procesadores. Es ese tipo de soporte oportuno que me encantaría ver de AMD (y hace muchos años fueron puntuales con su soporte inicial de GCC) de modo que para cuando estos procesadores se envíen, el soporte Znver4 idealmente ya estaría en un lanzamiento/compilador estable encontrado por las últimas distribuciones de Linux. En el momento de escribir este artículo, no se han publicado parches de Znver4 para revisión ascendente en el lado de LLVM/Clang mientras haya al menos una cadencia de lanzamiento de seis meses. Intel continúa liderando en el lado del software cuando se trata de su tiempo estelar de código abierto/Linux en la gran mayoría de los casos durante los últimos años. El tiempo de habilitación ascendente es una molestia recurrente que tengo con AMD en cada ciclo de lanzamiento; en el lado del compilador, la única razón lógica que tengo es que quieren jugar sus cartas de cerca y no revelar nuevos planes de extensión ISA para futuras generaciones de CPU demasiado pronto.

Concedido, a menos que esté compilando de forma optimizada código para el destino de la CPU del servidor, esta compatibilidad con el compilador Znver4 no es un gran (o ningún) problema para usted. Pero dado el creciente atractivo de AMD en el espacio de la computación de alto rendimiento (HPC), es un poco sorprendente que no hayan estado impulsando este soporte de compilador antes. Sin embargo, al menos debería haber un nuevo compilador AMD Optimizing C/C++ Compiler (AOCC) pronto donde Zen 4 esté en buena forma. Una vez que se publique la nueva versión de AOCC, sin duda ejecutaré algunos puntos de referencia del compilador en Génova para ver el impacto del soporte del compilador ajustado en estos procesadores de servidor Zen 4.

Además del excelente rendimiento y la compatibilidad con Linux para el lanzamiento, ¡otro aspecto interesante de EPYC de cuarta generación desde el lado de la plataforma de referencia es Titanite que se ejecuta con OpenBMC! Fue emocionante ver que OpenBMC de código abierto basado en Linux se usaba como la pila de software para el BMC de referencia y, con suerte, esto se traducirá en que más servidores de la serie EPYC 9004 usen OpenBMC. Además, es de esperar que el interés de la industria y los clientes en el firmware de código abierto continúe y que AMD pueda involucrarse más en Coreboot y otros elementos de firmware de código abierto.

Qué tan bien se compara Intel Sapphire Rapids con el EPYC de 4.ª generación Será una batalla interesante. Sapphire Rapids solo subirá a 60 núcleos en comparación con los 96 núcleos de Génova, pero la ventaja de Intel son las nuevas extensiones de matriz avanzada (AMX), AVX-512 FP16 y varios bloques aceleradores nuevos. Para el software capaz de aprovechar AMX y la IP del acelerador de Intel, será una competencia muy interesante al menos para Génova, pero para las cargas de trabajo de servidor más tradicionales presentará un desafío bastante significativo. del Xeon Platinum 8380 2P. También será interesante ver cómo Intel compite con la serie EPYC 9004 en precios, especialmente con Sapphire Rapids que presenta Intel On Demand/Software Defined Silicon que complica aún más la escena de precios, especialmente si está vinculado a los nuevos bloques aceleradores que se vuelven primordiales para ofrecer un rendimiento competitivo.. Un área que será interesante para Intel con Sapphire Rapids es su SKU HBM2e ahora conocido como Xeon Max, mientras que el próximo año AMD tendrá Genoa-X para anunciar. Entre los otros beneficios de los procesadores de la serie EPYC de 4.ª generación de AMD se incluyen la compatibilidad con CXL 1.1+ y la compatibilidad con SEV-SNP ampliada con mayores capacidades de cifrado de memoria y más máquinas virtuales.

Categories: IT Info