Embora inicialmente desconfiado da abordagem”double pumped”do AMD Zen 4 para suportar AVX-512 usando um caminho de dados de 256 bits, ele provou ser muito eficiente para desempenho e produzem ótimos resultados sem prejudicar o clock negativo ou causar estragos no consumo de energia. Em setembro, entreguei uma análise detalhada do desempenho do AVX-512 no Ryzen 9 7950X, enquanto neste artigo há uma análise detalhada do benchmark do Core i9 11900K contra o Ryzen 7 7700X. O Core i9 11900K sendo o último CPU de desktop Intel atualmente com suporte oficial ao AVX-512, enquanto o Ryzen 7 7700X foi usado para combinar a contagem de núcleos/threads desse processador Rocket Lake para esta comparação de ativação/desativação do AVX-512.
Embora os primeiros processadores Alder Lake permitissem que o AVX-512 desabilitasse os núcleos E, as atualizações do BIOS do sistema desabilitaram essa capacidade e também foram desativadas nos processadores Alder Lake posteriores (e agora Raptor Lake). Portanto, para comparar o desempenho Intel vs. AMD AVX-512 no lado do desktop, isso significa voltar ao processador Core i9 11900K”Rocket Lake”com seu suporte oficial ao AVX-512. O Core i9 11900K é um processador de 8 núcleos/16 threads com frequência base de 3,5 GHz e frequência turbo máxima de 5,3 GHz, com um TDP de 125 Watt anunciado.
Para usar 8 núcleos/16 threads no lado da AMD, o Ryzen 7 7700X foi usado com uma frequência base de 4,5 GHz e uma velocidade máxima de clock de 5,4 GHz e um TDP padrão de 105 Watts.
Pelo menos com as placas-mãe AMD X670 que testei até agora não houve a capacidade de desabilitar o AVX-512 de dentro do BIOS. Portanto, para esta comparação liga/desliga em ambos os sistemas, usei”clearcpuid=304″para que o kernel do Linux não anuncie as extensões do AVX-512 para os aplicativos que verificam a presença do AVX-512 via/proc/cpuinfo e também impede o uso do AVX pelo kernel-512 instruções. E, em seguida, para todos os benchmarks de código aberto, eles foram reconstruídos com”-mno-avx512f”para desabilitar as instruções do AVX-512 em comparação com as compilações nativas com o AVX-512 ativado.
Ambos os Intel Rocket Lake e os sistemas AMD Zen 4 foram configurados e testados de forma semelhante usando o Ubuntu 22.10 com o kernel Linux 5.19. Vários benchmarks compatíveis com o AVX-512 foram testados e, em seguida, testados novamente com o suporte ao AVX-512 desativado. Durante os testes, o consumo de energia do núcleo da CPU foi monitorado usando as interfaces RAPL expostas, bem como o monitoramento da frequência de pico da CPU obtida como a frequência de clock mais alta encontrada a cada segundo em qualquer um dos núcleos.
Aqui está uma olhada no Desempenho do AVX-512 Intel vs. AMD Linux no lado do desktop. E como um lembrete amigável… Se você gosta de todos os testes de hardware Linux, notícias de código aberto, etc, que eu faço diariamente no Phoronix, por favor considere se juntar ao Phoronix Premium para ajudar a mostrar seu apoio. A indústria de anúncios e o uso desenfreado de blocos de anúncios têm sido bastante brutais ultimamente… O Phoronix Premium oferece a você o site sem anúncios e artigos de várias páginas em uma única página.
Primeiro foi AI-Benchmark e para seu benchmark de treinamento de IA, houve um bom aumento do AVX-512 em ambas as CPUs de desktop… A ativação do AVX-512 melhorou a pontuação do Ryzen 7 7700X em 70%, enquanto o desempenho do processador Core i9 11900K aumentou em 61%.
Ou, ao analisar o desempenho de inferência de IA, o processador Intel Rocket Lake regrediu com o AVX-512 ativado, enquanto a pontuação do processador AMD Zen 4 melhorou em 23%.
Ao analisar a”pontuação de IA”geral”deste pacote de software, o desempenho do Core i9 11900K melhorou 27,5% com o AVX-512 ativado, enquanto o Ryzen 7 7700X aumentou 46%.
Neste benchmark específico, o AVX-512 usa no Rocket Lake não aumentou significativamente o consumo de energia como em algumas cargas de trabalho. O consumo de energia do Ryzen 7 7700X foi semelhante durante as duas execuções.
Com ambos os processadores são saudáveis, o desempenho por Watt aumenta graças ao AVX-512 com este benchmark de IA.
Outra carga de trabalho de IA fazendo uso do AVX-512 que foi testado é o DeepSparse da Neural Magic.
O DeepSparse estava desfrutando de um desempenho visivelmente melhor em ambos os processadores com o AVX-512 habilitado e melhorias relativas semelhantes em relação ao estado desligado do AVX-512.
Mas no caso do Intel Core i9 11900K, estava consumindo 13%+ mais energia ao empregar o AVX-512. Enquanto isso, o AMD Ryzen 7 7700X mostrava consistentemente o mesmo uso de energia com o AVX-512 ativado ou não.
O DeepSparse da Neural Magic estava mostrando muitos benefícios do AVX-512 para CPUs Intel e AMD. O desempenho do AMD Zen 4 mostrava que a implementação”double pumped”do AVX-512 ainda era muito eficaz e sem os grandes aumentos de potência observados com o Core i9 11900K.
O software OpenRadioss da Altair estava mostrando alguns benefícios de AVX-512.
O mecanismo de xadrez LeelaChessZero (LC0) acionado por IA também aproveitou o AVX-512 com seu back-end Eigen. O desempenho do AMD Ryzen 7 7700X aumentou 11% com o AVX-512 para o Core i9 11900K subindo 12%.
Mas com o LC0, o AVX-512 com a CPU Rocket Lake viu seu consumo de energia disparar em 23% e o consumo de energia de pico também aumentou em 23%. Não houve grande diferença de energia com o Ryzen 7 7700X, o que levou a um bom aumento de desempenho por Watt com o AVX-512 ativado.
Com as próprias bibliotecas de kernel de rastreamento de raio Embree da Intel, o AMD Zen 4 conseguiu para se beneficiar do AVX-512 muito mais do que o Core i9 11900K.
Embora o Core i9 11900K tenha visto pouco benefício do AVX-512 para Embree, seu consumo de energia foi significativamente maior ao usar o AVX-512.
A biblioteca de kernel de volume OpenVKL da Intel se beneficiou muito do AVX-512 para CPUs de desktop Intel e AMD.
Mas no caso do desempenho por Watt, o AMD Zen 4 estava em melhor forma e teve um consumo de energia ligeiramente menor em comparação com o grande aumento no uso de energia do i9-11900K.
O mecanismo de rastreamento de raio OSPRay da Intel também é bem otimizado para o AVX-512 graças ao Xeon pretendido Uso de CPU. Ambas as CPUs de desktop se beneficiaram do AVX-512 habilitado. Mas, novamente, com o Rocket Lake, isso significou um consumo de energia mensuravelmente maior.
O pacote de software OSPRay Studio da Intel destinado a criadores para necessidades de visualização interativa com rastreamento de raio teve melhorias saudáveis com o AVX-512 ativado.
Os tempos de renderização mais rápidos com o AVX-512 ativado foram ótimos, mas com o Core i9 11900K isso significou maior uso de energia, enquanto no caso do Ryzen 7 7700X foi capaz de aumentar o desempenho com o mesmo orçamento de energia.
O pacote de software oneDNN da Intel como outro componente de seu pacote de software oneAPI foi bem otimizado para o AVX-512 devido às suas intenções Xeon. O AMD Ryzen 7 7700X continuou a mostrar um ótimo desempenho aqui e a melhoria relativa da ativação do AVX-512.
Não é preciso dizer que o Ryzen 7 7700X estava mostrando um consumo de energia semelhante, independentemente do estado do AVX-512, enquanto o Core O i9 11900K viu seus ganhos de desempenho com o aumento do custo de energia.
O AVX-512 ajudou muito o desempenho de criptografia em vários testes no Cpuminer-opt. Em geral, houve melhorias fantásticas em ambas as CPUs com AVX-512 habilitado, enquanto apenas a CPU AMD Zen 4 poderia fornecer esses ganhos sem aumentos dramáticos de energia.
Ótimos resultados do AVX-512 com este benchmark de mineração/criptografia de CPU.
Outro beneficiário do AVX-512 foi o software Mobile Neural Network (MNN) do Alibaba.
Durante o benchmarking MNN, o consumo de energia do Core i9 11900K aumentou 13%, enquanto o consumo de energia do Ryzen 7 7700X não aumentou.
Foi uma história semelhante com o NCNN da Tencent também.
Como uma pequena surpresa com todos esses benchmarks de IA, tanto o Core i9 11900K quanto o Ryzen 7 7700X mostraram melhorias significativas no desempenho com o AVX-512 habilitado. Esta é uma notícia particularmente boa na frente do AMD Zen 4 por provar que sua abordagem”double pumped”é muito eficiente em fornecer ganhos semelhantes ou maiores do que os encontrados ao alternar o AVX-512 no Rocket Lake.
E então, muito empolgante com o AMD Zen 4 são os ganhos de desempenho do AVX-512 sem aumentar sua conta de energia.
OpenVINO também emprega o AVX-512 de forma muito eficaz e foi capaz de ajudar a aumentar o desempenho de IA para essas CPUs de desktop. Com o OpenVINO para alguns dos casos de teste, o desempenho do AVX-512 no Intel Core i9 11900K regrediu devido ao impacto de energia/térmico. Enquanto isso, o Ryzen 7 7700X estava consistentemente entregando melhores resultados com o AVX-512 ativado.
Os resultados do Ryzen 7 7700X AVX-512 também foram muito encorajadores com o ONNX da Microsoft. Enquanto isso, os resultados do Rocket Lake com o AVX-512 ativado/desativado foram misturados,
Numpy teve uma modesta aceleração de ~10% com o AVX-512 ativado.
Ao olhar para o pico Frequência da CPU a cada segundo durante toda a duração dos benchmarks, o pico médio com o Core i9 11900K não era tão diferente do estado desligado do AVX-512, mas, como mostrado no boxplot, há uma clara diferença, às vezes atingindo picos muito mais baixos do que quando o AVX-512 foi desativado. Enquanto isso, a frequência de pico da CPU não variou muito no Ryzen 7 7700X, independentemente do estado do AVX-512, semelhante à minha comparação anterior do AVX-512 no Ryzen 9 7950X.
Ao observar a potência da CPU consumo durante todo o período de benchmarks AVX-512 realizados, o Ryzen 7 7700X não se mexeu muito. O consumo de energia do Core i9 11900K aumentou, em média, 11% quando o AVX-512 foi ativado e seu consumo de energia de pico também aumentou 12%.
Se for feita a média geométrica de todo o desempenho bruto do AVX-512 resultados de benchmark, o Core i9 11900K melhorou em 31% com o AVX-512 habilitado. Enquanto isso, o Ryzen 7 7700X viu seu desempenho melhorar em 44% com o AVX-512 habilitado.
Simplificando, continuo muito impressionado com a implementação do AVX-512 da AMD com Zen 4 em toda a ampla gama de cargas de trabalho que’estive testando. Também é esplêndido ver o AVX-512 ser suportado em todos os processadores AMD Zen 4.
Veja minha análise do Core i9 13900K Linux e análise do Core i5 13600K Linux para comparações dos mais recentes CPUs Raptor Lake da Intel com o AMD Zen 4 se estiver curioso sobre o desempenho geral da CPU mais recente, em vez de apenas isolado ao AVX-512.