engenheiros da AMD lançou hoje o AOMP 16.0-0 como a versão mais recente de seu compilador downstream LLVM/Clang, onde eles encenam seus mais recentes patches de desenvolvimento focados no descarregamento do Radeon GPU OpenMP.
AOMP é a área de teste ou playground da AMD para seus patches de descarregamento de GPU até que sejam upstream dentro do próprio LLVM. O AOMP não deve ser confundido com o AOCC, pois o compilador Optimizing C/C++ da AMD se concentra em seu downstream enriquecido com Zen de LLVM/Clang para o lado da CPU da casa. Com o AOMP 16.0-0, eles se basearam novamente no código upstream LLVM mais recente da semana passada, além de adicionar alguns novos patches de descarregamento da Radeon.
O AOMP 16.0-0 captura o estado upstream do LLVM 16 Git a partir de 14 de setembro. O AOMP também extrai os componentes relevantes do ROCm com os quais lida sem o código do kernel AMDGPU/AMDKFD. Há apenas duas novas mudanças lideradas pela AMD com o AOMP 16.0-0:
-Adiciona o novo sinalizador-fopenmp-target-fast para habilitar um conjunto de otimizações de destino OpenMP.
-Melhorias e correções de bugs para suporte sem loop e redução entre equipes.
A nova opção -fopenmp-target-fast parece interessante em nome do desempenho. Fontes AOMP 16.0-0, bem como binários para sistemas Linux Ubuntu/SUSE/CentOS (RHEL) podem ser encontrados em GitHub.