Además de la gran mejora en el rendimiento de AVX-512, hasta 96 núcleos por socket y otras mejoras en la arquitectura de Zen 4, los procesadores EPYC 9004″Genoa”también potencian la compatibilidad con hasta 12 canales de DDR5-4800 memoria. En este artículo hay una amplia variedad de puntos de referencia que analizan el rendimiento de AMD EPYC 9654 en una cantidad variable de canales de memoria DDR5 ocupados.

Los procesadores AMD EPYC de 4.ª generación admiten doce canales de memoria DDR5 en Velocidades DDR5-4800 y puede manejar hasta 6 TB de memoria direccionable por socket. Esta es una gran actualización con respecto a las generaciones anteriores de procesadores EPYC con ocho canales de memoria DDR4-3200 y lo que se encuentra con los procesadores Xeon Scalable”Ice Lake”actuales. Pero el costo de llenar los 12 canales de memoria, especialmente con el precio inicial de la memoria del servidor DDR5, puede ser demasiado para manejar a la vez para algunas implementaciones y más difícil de justificar dentro de las organizaciones durante estos tiempos económicos turbulentos. Por lo tanto, me propuse ejecutar algunos puntos de referencia durante las vacaciones para observar el rendimiento de EPYC Genoa desde 6 hasta 12 canales de memoria con estos procesadores de servidor Zen 4.

Para cargas de trabajo intensivas en memoria, la ampliación a través de 12 canales estaba ahí y los procesadores EPYC 9654 demostraron que podían hacer uso efectivo de los doce canales de memoria por socket. Obviamente, aunque no todas las cargas de trabajo requieren mucha memoria, estos puntos de referencia están pensados ​​como una combinación de puntos de referencia que muestran cómo respondió el rendimiento del EPYC 9654 2P bajo una combinación de cargas de trabajo, ya sea que esté tratando de evaluar si vale la pena optar inicialmente por 12 (o 24). ) DIMM o simplemente necesita algunos números independientes para ayudar a justificar el gasto a su jefe/gerencia.

Para aquellos que no han mirado los precios de la memoria del servidor DDR5, al momento de escribir el Los DIMM más baratos que he visto son los módulos de memoria Samsung DDR5-4800 de 16 GB a alrededor de $ 100 USD o $ 183 USD para la versión de 32 GB. Los módulos de memoria de servidor DDR5-4800 de 64 GB se venden al por menor por alrededor de $ 350… Por lo tanto, elegir 12 DIMM o incluso 24 DIMM para un servidor AMD EPYC de 4.ª generación de dos sockets puede sumarse rápidamente.

Con el servidor de referencia AMD Titanite y los procesadores duales EPYC 9654 de 64 núcleos, completé varios puntos de referencia (principalmente centrados en el mundo real) en 6, 8, 10 y 12 canales de memoria. Toda la memoria eran módulos de memoria Samsung M321R8GA0BB0-CQKEG de 64 GB DDR5-4800MT/s, proporcionados amablemente por AMD como parte del kit de revisión EPYC Genoa. EPYC Genoa puede manejar configuraciones de hasta un canal de memoria, mientras que para esta prueba la atención se centró en 6 canales de memoria y más, simplemente por no tener demasiadas limitaciones de memoria, lo que reduce la carga de prueba al tener muchas pruebas diferentes limitadas por este único EPYC. servidor Genoa en este momento, y la baja probabilidad de que los usuarios adquieran un procesador de la serie EPYC 9004 de nivel superior y se ejecuten en un escenario tan limitado de RAM.

Esta prueba de rendimiento de escalado del canal de memoria para AMD EPYC Genoa se llevó a cabo mientras que el servidor Titanite ejecutaba Ubuntu 22.10 pero se actualizaba al kernel de Linux 6.1 como parte de mi software habitual de última generación, analizaba el rendimiento.

Con NAS Parallel Benchmarks de la NASA para su análisis de referencia Integer Sort (IS) por el rendimiento de acceso aleatorio a la memoria, no es de extrañar que se esté escalando bien a través de la configuración de 12 canales de memoria de Génova.

Del mismo modo, con la prueba de redes múltiples (MG) de NPB en una secuencia de mallas se mostró fuerte y aumento constante del rendimiento a través de la compatibilidad con 12 canales de memoria de Genoa.

El solucionador Scalar Penta-diagonal de NPB reforzó aún más la eficacia de 12 canales de compatibilidad con memoria de servidor DDR5 con EPYC de 4.ª generación.

La El solucionador nekRS Navier Stokes mostró una gran escalabilidad a través de los 12 canales de memoria.

El paquete de dinámica de fluidos computacional (CFD) OpenFOAM de código abierto hace un gran trabajo al mostrar los beneficios de hasta doce memorias DDR5-4800 canales en el mundo real y el impacto en el rendimiento. Aquí, sin embargo, el beneficio de pasar de 10 a 12 canales de memoria fue mucho menos significativo para un modelo de tamaño mediano, si buscaba reducir algunos costos del servidor CFD.

Pero, por supuesto, no todas las cargas de trabajo del servidor son uso intensivo de memoria donde sería de gran ayuda para llenar los 12 canales de memoria, especialmente si se opera con un presupuesto ajustado.

Para varias cargas de trabajo, ejecutar 10 canales de memoria proporcionaría un valor ligeramente mejor o si busca evitar algunos de los costos de la memoria del servidor DDR5 para un trimestre posterior.

Para algunas de las bibliotecas comunes de Intel utilizadas en el software de creación, como OpenVKL de oneAPI y Open Image, Denoise no había visto mucho beneficio más allá de los 8 canales. , al menos para las configuraciones de referencia probadas.

Compresión 7zip

Para aquellos que buscan procesadores de servidor AMD EPYC Genoa para usar en una granja de compilación/CI u otros entornos frecuentes de compilación de código con su a 96 núcleos/192 subprocesos, no hubo una diferencia medible en la velocidad de compilación a 6 mem canales ory o superior, incluso con el uso de 384 trabajos paralelos para el servidor EPYC 9654 2P.

El benchmark Graph500 HPC obviamente disfrutó de los canales de memoria adicionales encontrados con las CPU EPYC Genoa…

Para algunos de los puntos de referencia de la biblioteca de redes neuronales Intel oneDNN hubo una ampliación de hasta 12 canales de memoria, mientras que para los casos de prueba más pequeños no hubo un impacto medible.

El rendimiento de TensorFlow ResNet-50 se benefició al aumentar a 12 canales de memoria si se usa un modelo lo suficientemente grande o un tamaño de lote.

Para el software DeepSparse de Neural Magic, dependía del modelo de IA particular para ver los beneficios (o no) de los canales de memoria adicionales.

p>

OpenVINO con los modelos probados generalmente vio solo pequeñas mejoras en el rendimiento de los canales de memoria más altos, pero depende en gran medida de los modelos que se utilicen.

El software de pronóstico del tiempo WRF ciertamente podría hacer uso de las doce memorias canales con la serie AMD EPYC 9004, pero si su presupuesto es c Bajo restricciones, ejecutar con diez DIMM por zócalo puede resultar ser la mejor inversión.

El rendimiento de renderizado de Blender 3.4 con escenas más grandes como Classroom y Barbershop no vio ninguna diferencia medible de seis a doce canales con los procesadores EPYC 9654.

Esperemos que estos datos de referencia hayan sido de alguna ayuda si tiene curiosidad sobre los beneficios o la justificación independiente de los doce canales de memoria DDR5 disponibles con los procesadores AMD EPYC 9004″Genoa”. Aquellos interesados ​​en obtener aún más datos de varias cargas de trabajo diferentes pueden encontrar más de 130 resultados de referencia diferentes de esta comparación de canales de memoria del 8/6/10/12 aquí con la configuración EPYC 9654 2P.

Al tomar la media geométrica solo para las cargas de trabajo capaces de aprovechar de manera efectiva el paso de 6 a 12 canales de memoria, así es como se compara. Pasar de seis a ocho canales y de ocho a diez canales en cada paso fue una mejora del 16~20 % en el rendimiento, pero pasar de diez a doce canales se redujo a una mejora del 10 %. Si no necesita maximizar su capacidad de RAM direccionable y busca reducir algunos costos a una actualización de la serie EPYC 9004 (o al menos cambiar algunos costos adicionales por otro trimestre o una vez que los precios de la memoria del servidor DDR5 hayan bajado), ejecutar a 10 DIMM por socket sería proporciona un valor ligeramente mejor para varias de las cargas de trabajo probadas sin perder demasiado rendimiento. Para cargas de trabajo como WRF, OpenFOAM, nekRS y cargas de trabajo de IA seleccionadas según el modelo, definitivamente vale la pena optar por doce canales de memoria DDR5-4800 con los procesadores de la serie AMD EPYC 9004 para lograr el máximo rendimiento.

Categories: IT Info