O desenvolvedor do emulador RPCS3’PlayStation 3’postou um blog detalhado destacando a vantagem do AVX-512 em CPUs modernas. A postagem do blog nos ajuda a entender como o AVX-512 funciona e como ele é benéfico para o emulador para quem deseja obter desempenho extra.

RPCS3’PlayStation 3 Emulator’Destaques do desenvolvedor A vantagem de desempenho do AVX-512 CPUs habilitadas

O blog foi publicado por Whatcookie, um dos muitos desenvolvedores do emulador RPCS3 projeto e compara como o AVX-512 ajuda em relação às instruções padrão do AVX2. Você pode ler o blog completo aqui ou para simplificar, as principais vantagens do AVX-512 vêm na forma de:

GPUs AMD Radeon obtêm grande aumento, até 55%, no desempenho gráfico OpenGL com o lançamento do driver Windows 11 22H2 em breve

Arquivo de registro maior Novas formas de instruções antigas Registros de máscara

O desenvolvedor mostra como tudo isso ajuda a melhorar o desempenho dentro do RPCS3, a escolha para emuladores de PS3. Uma CPU Intel Core i9-12900K foi usada para testes em 5,2 GHz com AVX-512 habilitado. Usando as instruções padrão do SSE2, o jogo forneceu apenas 5 FPS, enquanto a mudança para o SSE 4.1 proporcionou um ganho maciço de 160 FPS. Afirma-se que a razão para isso é devido à falta de instruções SSSE3 que são essenciais para o emulador de PlayStation 3.

Movendo para AVX2/FMA, você recebe 13 adicionais % de aumento de desempenho e alternando de AVX2 para AVX-512, você obtém um aumento de desempenho de 30% para 242 FPS.

O alvo SSE4.1 atinge uma média de 160 FPS, enquanto o AVX2/O alvo FMA atinge uma média de 190 FPS. Esta é uma melhoria de 18% em relação à meta SSE4.1. O AVX2 não inclui muitas instruções novas sobre o SSE4.1, mas inclui um novo formulário de 3 operandos para instruções, o que elimina muitas instruções de registro para registro mov . Fundamentalmente, todas as CPUs compatíveis com AVX2 também oferecem suporte às instruções FMA. As instruções FMA não são apenas mais rápidas do que uma cadeia de instruções de multiplicação + adição, mas também podem produzir resultados diferentes devido ao não arredondamento para precisão única entre a multiplicação e a adição. Emular isso com precisão sem instruções FMA adiciona alguma sobrecarga e, portanto, as operações FMA nativas ajudam bastante.

O alvo AVX-512 de nível Icelake atinge uma média absurda de 235 FPS, 23% mais rápido que o AVX2/FMA alvo. O grande número de novas instruções adicionadas no AVX-512 é tão grande que muitas delas acabam sendo úteis para o RPCS3. Ao contrário do AVX2, que era principalmente uma extensão direta das instruções SSE existentes para 256 bits, o AVX-512 inclui um grande número de novos recursos que são muito úteis para programação SIMD, mesmo em larguras de bits menores. No entanto, como a Intel optou por comercializar o AVX-512 com o apelido-512, as pessoas que não estão familiarizadas com o conjunto de instruções geralmente se fixam no aspecto vetorial de 512 bits do conjunto de instruções.

via Whatcookie Github Blog

Embora a Intel tenha removido o suporte ao AVX-512 de suas CPUs Alder Lake de 12ª geração, vimos o potencial de desempenho e parece que a linha de CPUs Zen 4’Ryzen 7000’recentemente anunciada da AMD pode tirar grande proveito disso. A arquitetura de núcleo Zen 4 suportará o AVX-512 e se houver um sucessor do Steam Deck ou vários outros consoles portáteis que utilizem as CPUs de última geração, podemos ver vários usuários aproveitando o conjunto de instruções para emular jogos mais antigos com muito bom desempenho.

Isso será muito benéfico para o emulador RPCS3’PlayStation 3’e pode forçar a equipe azul a reconsiderar a remoção do AVX-512 de seus chips de consumo.

Fonte de notícias: RPCS3

Categories: IT Info