Na semana passada, para o dia de lançamento do AMD EPYC 4th Gen”Genoa”, publiquei os benchmarks iniciais AMD EPYC 9554 e EPYC 9654 Linux como parte de minha análise. Esses processadores Zen 4 de 64 e 96 núcleos tiveram um desempenho fenomenal com Genoa tendo AVX-512, doze canais de suporte de memória do sistema DDR5-4800, maior permissão de TDP e outras melhorias em relação aos processadores de servidor Milan(X) anteriores. O outro SKU que a AMD enviou para revisão é o EPYC 9374F como sua nova peça de alta frequência de 32 núcleos. Por menos de US $ 5 mil, o EPYC 9374F é uma peça Zen 4 de 32 núcleos de alta frequência com um TDP de 320 watts. Os benchmarks de hoje estão comparando o EPYC 9374F com o EPYC 9554/9654 e vários outros processadores AMD EPYC e Intel Xeon Scalable no Linux.

O EPYC 9374F possui 32 núcleos/64 threads , possui um cache L3 de 256 MB, roda em uma frequência base de 3,85 GHz e frequência de aumento de 4,3 GHz. Para atingir essas altas frequências em 32 núcleos, o EPYC 9374F possui um TDP padrão de 320 Watts e um TDP configurável de 320 a 400 Watts. A frequência base de 3,85 GHz é a segunda mais alta na linha EPYC Genoa, perdendo apenas para o processador EPYC 9274F de 24 núcleos, que é uma CPU de 320 watts com uma frequência base de 4,05 GHz e possui uma frequência máxima de aumento de 4,3 GHz, assim como o 9374F maior. O EPYC 9374F tem um preço sugerido de US$ 4850.

Em comparação, a geração anterior EPYC 75F3 era a parte de alta frequência de 32 núcleos para o Milan. O EPYC 75F3 tinha um clock base de 2,95 GHz e um clock de impulso máximo de 4,0 GHz, enquanto tinha um TDP de 280 Watts. Com o EPYC 9374F, geracionalmente, isso representa um aumento de 30% no clock base e 7,5% no clock de reforço, enquanto o TDP padrão é 14% maior. O preço de 1KU no lançamento do EPYC 75F3 era de $ 4860, basicamente o mesmo preço do novo EPYC 9374F. Comprar o novo EPYC 75F3 agora pode ser encontrado por $ 5195 USD ou até cerca de $ 5600 em alguns varejistas da Internet.

Além do EPYC 9274F e 9374F, há também o EPYC 9174F como uma parte de 16 núcleos de alta frequência e, em seguida, o EPYC 9474F como parte de alta frequência de 48 núcleos-uma frequência base de 3,6 GHz e uma frequência de aumento de 4,1 GHz para o processador TDP de 360 ​​watts. Esses processadores Genoa”F”têm os mesmos recursos arquitetônicos Zen 4 em comum com o restante da linha da série EPYC 9004, incluindo doze canais de memória DDR5-4800, PCIe 5.0, CXL 1.1+ e os outros recursos Genoa abordados na semana passada.

Semelhante à análise EPYC 9554/9654 Linux da semana passada, o EPYC 9374F foi testado em configurações 1P e 2P. Em ambas as configurações, também testei no modo de determinismo de”desempenho”padrão e, em seguida, optei pelo BIOS para o modo de determinismo de”energia”.

Enquanto o Ubuntu 22.04 LTS funciona muito bem para os processadores Genoa e o servidor de referência AMD Titanite plataforma, para todo esse benchmarking de lançamento, tenho usado o Ubuntu 22.10 com o kernel Linux 6.0 para fornecer uma visão muito nova e atualizada do desempenho do Linux, inclusive com o uso do compilador de sistema GCC 12 em vez do GCC 11 como padrão em 22.04 LTS, etc.

Agradecemos à AMD por fornecer as amostras de revisão da série EPYC 9004 e a plataforma de referência Titanite por tornar esse benchmarking possível. Os processadores testados/testados novamente para a análise de hoje incluíram as seguintes configurações:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P-EPYC 9374F
-EPYC 9374F-Potência
-EPYC 9374F 2P
-EPYC 9374F 2P-Potência
>-EPYC 9554
-EPYC 9554-Potência
-EPYC 9554 2P
-EPYC 9554 2P-Potência
-EPYC 9654
-EPYC 9654-Potência
-EPYC 9654 2P
-EPYC 9654 2P-Potência
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Novamente, conforme observado anteriormente neste artigo e na análise anterior do EPYC 9654/9554, as execuções”-Power”ocorrem ao ativar o modo de determinismo de energia do BIOS como informações adicionais sobre o desempenho dessa configuração não padrão. Todos esses benchmarks foram realizados no Ubuntu 22.10 usando o kernel Linux 6.0 e o GCC 12 como compilador padrão do sistema. O governador de desempenho estava em uso em todos os sistemas testados.

Cada CPU foi testada com seu número máximo de canais de memória suportados e com a memória do servidor na frequência nominal máxima. Uma ampla gama de benchmarks foi realizada ao mesmo tempo em que monitorava o consumo de energia da CPU das interfaces Linux RAPL sysfs expostas para também fornecer a visão de desempenho por Watt. Os gráficos de desempenho por dólar são baseados nas informações de preço Genoa SEP fornecidas pela AMD e, em seguida, para os processadores Milan(X) e Ice Lake com base nos preços de varejo atuais dos principais varejistas da Internet.

Iniciando o benchmarking A concorrência foi GPAW como o primeiro de um grande lote de benchmarks de HPC executados no EPYC 9374F 1P/2P e outros processadores testados. O EPYC 9374F em 1P (e com o determinismo de desempenho padrão) viu seu desempenho corresponder ao da configuração EPYC 75F3 2P da geração anterior! Esta é uma das cargas de trabalho que tira proveito do AVX-512 com grande benefício, além do 9374F ter um clock base 30% maior em relação ao 75F3 da geração anterior, DDR5-4800 de 12 canais sobre DDR4-3200 de 8 canais e outras melhorias que levam ao enorme melhoria geracional. O desempenho do EPYC 9374F foi muito melhor do que o processador Xeon Platinum 8362 de 32 núcleos.

Ao executar o GPAW, o EPYC 9374F em uma configuração de processador único teve um consumo médio de energia de 225 Watts ou um pico de 253 Watts, em comparação, a geração anterior EPYC 75F3 tinha uma média de 244 Watts e um pico de 272 Watts. Embora o EPYC 9374F no modo de determinismo de energia tenha levado a uma média de 260 Watts e um pico de 312 Watts para este benchmark específico. No modo de determinismo de desempenho padrão, as configurações EPYC 9374F 1P e 2P tiveram menor consumo de energia médio e de pico do que os processadores Xeon Platinum 8362 e 8380.

Com base no desempenho por dólar, o preço sugerido de o EPYC 9374F é muito competitivo para as CPUs de servidor Intel e AMD atualmente disponíveis com os preços atuais da Internet.

O EPYC 9374F continuou a impressionar, desta vez com GROMACS. O EPYC 9374F foi 38% mais rápido que o EPYC 75F3 ou uma melhoria de 50% ao comparar os resultados 2P. Obviamente, se estiver executando no modo de determinismo de potência, a elevação é ainda maior. Graças ao aproveitamento do AVX-512, os doze canais de memória do sistema DDR5-4800 e outros benefícios do Zen 4, no GROMACS o EPYC 9374F saiu à frente do EPYC 7763 carro-chefe da geração anterior!

Em um desempenho-por Watt, o processador EPYC 9374F teve um desempenho muito bom junto com os outros processadores Genoa em comparação com o Milan–o desempenho 2P por Watt do EPYC 9374F foi 69% melhor do que a geração anterior EPYC 75F3.

O EPYC 9374F SEP mostra o desempenho por dólar comparável aos CPUs Milan e Ice Lake existentes.

Com o popular pacote de software NAMD para dinâmica molecular, o EPYC 75F3 de 32 núcleos de alta frequência A parte Milan ficou entre as partes Ice Lake Xeon Platinum 8362 32 núcleos e Xeon Platinum 8380 40 núcleos, enquanto agora o EPYC 9374F supera facilmente o processador Ice Lake de ponta nas configurações 1P e 2P.

Quando no modo de determinismo de desempenho padrão, o EPYC 9374F mostrava menor consumo de energia do que o Xeon Platinum 83 62 e 8380.

E o desempenho por dólar do EPYC 9374F também supera facilmente a concorrência do Intel Ice Lake. Será muito interessante ver onde o Sapphire Rapids se encaixa em termos de preços, especialmente considerando Intel On Demand (silício definido por software).

O AMD EPYC de 4ª geração funciona especialmente bem com o modelo de previsão do tempo WRF. Um único processador AMD EPYC 9374F quase igualou o desempenho do Xeon Platinum 8362 2P! O único EPYC 9374F também superou a configuração EPYC 75F3 2P graças ao AVX-512, a memória mais rápida e mais canais de memória, maior orçamento de energia, etc.

O consumo de energia da CPU durante a execução do WRF também favoreceu o EPYC 9374F processadores Xeon Platinum 8362/8380.

Os resultados do EPYC 9374F foram bastante impressionantes, assim como o nível de empolgação da semana passada em torno dos resultados de benchmark EPYC 9654 e 9554. Graças ao AVX-512 e às principais atualizações de plataforma com o EPYC Zen 4, em alguns dos testes de computação de alto desempenho, a parte de alta frequência de 32 núcleos estava competindo com os carros-chefe EPYC Zen 3 de 64 núcleos da geração anterior.

No geral, o EPYC 9374F teve um ótimo desempenho e apresentou melhorias geracionais surpreendentes em relação ao EPYC 75F3. O EPYC 9374F superou consistentemente não apenas o Xeon Platinum 8362 de 32 núcleos, mas também o carro-chefe Xeon Platinum 8380.

O software de química computacional de código aberto NWChem é uma das cargas de trabalho de HPC que se adapta bem, mas não muito eficientemente agora em mais de 128 núcleos, pelo menos com o modelo de benchmarking usado. Aqui, com o NWChem, o EPYC 9374F exibia uma excelente elevação geracional sobre o EPYC 75F3, enquanto na configuração 2P atingia o topo do pacote. Xeon Scalable Ice Lake não competia com as CPUs Xeon Platinum 8362/8380 nem mesmo combinando com a geração anterior EPYC 75F3.

Durante o NWChem, o consumo médio de energia do EPYC 9374F foi de 243 Watts contra o Xeon Platinum 8362 a 264 Watts e o Xeon Platinum 8380 a 269 Watts.

As CPUs Xeon Platinum também não conseguiram competir em preço com a NWChem.

A elevação geracional do EPYC 75F3 para o EPYC 94F3 continuou a se mostrar fenomenal em uma ampla gama de cargas de trabalho de HPC. Em alguns desses casos de teste de HPC, um EPYC 9374F solitário no modo de determinismo de energia pode se aproximar do Xeon Platinum 8362 em uma configuração 2P.

OpenVINO é uma das cargas de trabalho com melhorias muito dramáticas de Milão a Gênova, graças ao AVX-512. Com alguns dos modelos OpenVINO, um único EPYC 9374F provou ser tão rápido quanto dois processadores Xeon Platinum 8362 ou 8380!

Para cargas de trabalho de IA/aprendizagem profunda com benefício AVX-512, a série AMD EPYC 9004 pode provou ser um valor fenomenal pelo menos no que diz respeito aos custos da CPU.

Graças em grande parte ao AVX-512, a melhoria da geração anterior EPYC 75F3 para EPYC 9374F foi impressionante. Um único EPYC 9374F em alguns desses benchmarks OpenVINO poderia superar os SKUs Milan de ponta em uma configuração 2P.

Em todos os benchmarks OpenVINO realizados, os processadores AMD EPYC Genoa apresentaram desempenho incrível em relação ao EPYC Milan (X) e em comparação com os atuais processadores Intel Xeon Scalable de 3ª geração.

A biblioteca de rede neural oneDNN da Intel foi outra carga de trabalho do mundo real mostrando melhorias dramáticas com todos os processadores EPYC Genoa testados graças ao AVX-512.

Para cargas de trabalho”simples”, como compilação de código, o EPYC 9374F teve um bom desempenho. O EPYC 9374F ao compilar o LLVM com Ninja levou 26% menos tempo do que ao usar o EPYC 75F3.

Para grandes projetos como Godot, mas ainda não tão grandes quanto o LLVM com o número de arquivos de origem que podem ser compilados em paralelo, o EPYC 9374F de alta frequência compensou e apresentou resultados líderes entre os processadores testados.

O EPYC 9374F ao compilar o Godot nas configurações 1P e 2P consumia menos energia do que o EPYC 75F3.

O EPYC 9374F pode construir o kernel Linux x86_64 padrão em 30 segundos–o mesmo tempo que as configurações Xeon Platinum 8362/8380 2P. Ou, na configuração de soquete duplo, o EPYC 9374F forneceu uma compilação de kernel em apenas 21 segundos.

Ou para criar todos os módulos do kernel Linux para uma compilação de kernel completa, o EPYC 9374F estava levando 279 segundos ou 169 segundos em uma configuração de soquete duplo ou reduzido para 151 segundos no modo de determinismo de energia.

Para eficiência de energia e desempenho por dólar, o EPYC 9374F também parecia bom nos benchmarks de compilação cronometrada.

Para o benchmark 7-Zip, o EPYC 9374F foi 20% mais rápido que o EPYC 75F3.

O EPYC 9374F também mostrou grande melhoria geracional em relação ao EPYC 75F3 com o software de modelagem 3D Blender.

O EPYC 9374F por menos de US$ 5.000 também apresentou grande valor em comparação com os outros processadores testados.

O Embree da Intel é outra carga de trabalho de criador que tem um desempenho excepcionalmente bom no Genoa. Graças à Intel ter ajustado bem o Embree e seus outros pacotes de software para AVX-512, Genoa está em ótima forma.

Ao usar o Embree com o compilador ISPC, o EPYC 9374F foi 51% mais rápido que o EPYC 75F3 e até saiu um pouco à frente do EPYC 7713. Ou o único EPYC 9374F rodando com o modo de determinismo de energia foi capaz para sair logo à frente do EPYC 75F3 2P! A configuração EPYC 9374F 2P foi 1,59x a velocidade da configuração EPYC 75F3 2P.

O forte desempenho do Embree também se igualou ao desempenho líder por dólar e desempenho por Watt com Genoa.

Com a biblioteca Open Image Denoise da Intel, houve uma grande melhoria geracional do EPYC 75F3 para o 9374F, enquanto essa foi uma das raras cargas de trabalho em que o EPYC 9374F teve desempenho semelhante ao do processador Xeon Platinum 8362 Ice Lake de 32 núcleos.

Ao migrar para o software OSPRay da Intel, o EPYC 9374F estava de volta à liderança elevada sobre o Xeon Platinum 8362 e até superando o 8380 em configurações de soquete único e duplo.

Completo da Intel O software OSPRay Studio também apresentou uma grande elevação geracional do EPYC 75F3 e uma concorrência acirrada para os processadores Intel Xeon Ice Lake.

Com o renderizador de código aberto LuxCore, houve melhorias geracionais muito pesadas para desfrutar com o AMD 32-processadores centrais de alta frequência.

Para aqueles e depois de um ponto ideal de 32 núcleos/64 threads por processador, o EPYC 9374F é definitivamente um candidato interessante.

A biblioteca de análise simdjson JSON é uma das cargas de trabalho que se beneficia muito da execução do AVX-512.

Os processadores EPYC de alta frequência obviamente têm um desempenho ainda melhor com os testes de análise de carga de trabalho Python de thread único. Os F SKUs se saem muito bem se estiverem preocupados principalmente com a execução de muitos programas Python de thread único ou outras tarefas de thread único.

Para desempenho de PHP de thread único, havia agora uma vantagem considerável sobre o Xeon Scalable Ice Lake.

Da mesma forma, o desempenho do software de rádio definido pelo software srsRAN produziu resultados muito melhores com o SKU otimizado para frequência.

A biblioteca de finanças quantitativas QuantLib também funciona muito bem com o EPYC 9374F.

No geral, o EPYC 9374F forneceu consistentemente um aumento geracional muito significativo em relação ao EPYC 75F3 e superou rotineiramente não apenas o Xeon Platinum 8362 de 32 núcleos, mas também o carro-chefe Xeon Platinum 8380.

Os processadores EPYC Genoa têm um desempenho maravilhoso com o software de dinâmica de fluidos computacional OpenFOAM 10.

Com o Altair OpenRadioss também houve um ótimo desempenho geracional do EPYC 75F3 ao EPYC 9374F.

Ao longo de cerca de 200 benchmarks realizados, acima é uma olhada no po registrado da CPU nosso consumo ao longo de todo o dia de benchmarking para cada CPU. O EPYC 9374F teve um consumo médio de energia de 195 Watts e um pico registrado de 275 Watts. Quando no modo de determinismo de energia, o EPYC 9374F teve uma média de 220 Watts e um pico de 327 Watts para esta combinação de cargas de trabalho únicas e multithread executadas. Surpreendentemente, o EPYC 9374F teve menor consumo geral de energia em média do que o antecessor EPYC 75F3 na configuração 1P. Na configuração 1P também foi menor consumo de energia em média do que o Xeon Platinum 8362 e 8380 que normalmente estava destruindo com melhor desempenho.

Ao tirar a média geométrica de todos os benchmarks que rodaram com sucesso em todos os processadores testados , é assim que as coisas se agitam. Lembre-se de que foram realizados cerca de 200 benchmarks com uma mistura de cargas de trabalho únicas e multithread com alguns testes que escalam excepcionalmente bem e outros que lutam para usar efetivamente 384 threads oferecidos pelo EPYC 9654. Enquanto isso, algumas cargas de trabalho que tornam eficaz uso do AVX-512 encontra seu desempenho até várias vezes melhor com o Genoa. De qualquer forma, essa visão geral do desempenho mostra a força de cisalhamento dos processadores EPYC Genoa com suas melhorias arquitetônicas Zen 4, principalmente lideradas por AVX-512, doze canais de memória do sistema DDR5, TDP elevado e outros aprimoramentos que levam a uma enorme elevação geracional.

A partir dessa média geográfica, o EPYC 9374F em uma configuração de soquete único quase correspondeu ao Xeon Platinum 8380 2P… O EPYC 9374F estava funcionando a 1,5x a velocidade do EPYC 75F3, em grande parte graças a muitos Cargas de trabalho do AVX-512 relevantes no espaço do servidor e do HPC. Especialmente se você estiver executando com frequência muitas cargas de trabalho pesadas do AVX-512, isso por si só deve ser motivo suficiente para garantir uma atualização para o hardware da série AMD EPYC 9004. Em uma configuração 2P, o EPYC 9374F ainda era 1,5x a velocidade da configuração EPYC 75F3 2P Milan–ou 1,51x a velocidade da configuração Xeon Platinum 8380 2P com essa grande variedade de benchmarks realizados.

Para aqueles com cargas de trabalho sensíveis à frequência mais do que a capacidade de escalar até 192 núcleos/384 threads com o carro-chefe EPYC 9654 em uma configuração de dois soquetes, o EPYC 9374F é uma peça muito interessante para o ponto ideal de 32 núcleos e deve ser vendido por menos de $ 5k. Os custos atuais da plataforma com a cara memória do sistema DDR5 diminuem um pouco da empolgação, mas, no geral, o desempenho da série EPYC 9004 continua a ser surpreendente. Especialmente ao aproveitar o AVX-512 em suas cargas de trabalho de produção, o desempenho incrível e a eficiência de energia devem facilmente provar um investimento valioso e resultar em um TCO atraente.

Como no teste EPYC 9554 e 9654, mudar para o modo de determinismo de energia do determinismo de desempenho padrão permitiu um aumento extra de desempenho. O EPYC 9374F no modo de determinismo de energia viu seu desempenho aumentar em pouco menos de 4% no geral, mas algumas cargas de trabalho se beneficiaram mais significativamente desse modo alternativo.

Aqueles que desejam passar por todos os benchmarks completos deste Ubuntu 22.10 + Linux 6.0 comparison across the wide span of Intel and AMD server processors can find the data via this result page for further analyzing all of the individual workloads and the complementary performance-per-dollar e métricas de desempenho por Watt. Agradecemos à AMD por fornecer as amostras de análise do Genoa e fique atento para outros benchmarks que analisam o desempenho com vários números de canais de memória, benchmarks de compilador e outros testes de ajuste.

Categories: IT Info