Além disso para os engenheiros da AMD que estão ocupados trabalhando no suporte gráfico RDNA3 para sua pilha de drivers gráficos Linux de código aberto, ao mesmo tempo eles também estão trabalhando para habilitar o GFX940 como sua parte CDNA de última geração, presumivelmente para lançar como o AMD Instinct MI300 se as tradições se mantiverem.
Desde março, vimos a AMD publicar vários patches do GFX940 no LLVM para o back-end do compilador de sombreador AMDGPU e, com sua abordagem bloco a bloco, upstream vários elementos da parte CDNA de última geração no kernel Linux upstream para o driver do kernel AMDGPU.
Já vimos alguns elementos interessantes para o acelerador de última geração, como o WMMA, para operações de multiplicação e acumulação de matriz de precisão mista para núcleos de matriz de GPU. Novas instruções atômicas de ponto flutuante também foram adicionadas.
Combinadas hoje para o LLVM Git são as instruções nativas do FP8 sendo introduzidas com o GFX940. Este acelerador profissional de última geração está trazendo instruções nativas de FP8 e BF8 para a GPU para ajudar no desempenho de IA/rede neural.
A arquitetura GH100 Hopper da NVIDIA também tem suporte a ponto flutuante FP8 de oito bits e, da mesma forma, o novo Habana Labs Gaudi2 da Intel tem suporte ao formato FP8 nativo. O FP8 para o Instinct MI300 foi divulgado anteriormente, mas agora praticamente resumido ao ver as instruções do FP8 chegarem ao back-end AMDGPU LLVM. O FP8 se tornará mais importante para as cargas de trabalho de IA no futuro.
Até agora estes três commits como de escrita começaram a canalizar o suporte de instrução FP8 no back-end do compilador de sombreador AMDGPU e preparar o suporte de conversão de outros formatos.
Esse trabalho do GFX940 está acontecendo no LLVM Git para LLVM 15.0, que será lançado como estável em setembro, enquanto o congelamento/ramificação de recursos começa na próxima semana.