Alguns novos patches de sistema heterogêneo AMD foram colocados na fila via TIP.git antes da próxima janela de mesclagem do kernel Linux 6.5. Esses novos patches do AMD Linux estão focados na enumeração adequada de sistemas heterogêneos para sistemas de data center da AMD que ostentam o Instinct MI200 e aceleradores mais recentes.
O driver AMD EDAC (Error Detection and Correction) está sendo estendido com suporte para processadores AMD Heterogeneous Family 19h Modelo 30h-3Fh. As mais de 300 linhas do novo código patch explica:
“Os sistemas AMD Family 19h Modelo 30h-3Fh podem ser conectados a dispositivos aceleradores/GPU AMD MI200 de forma que as malhas de dados da CPU e da GPU sejam conectadas juntas. Nessa configuração, a CPU gerencia o registro de erros e relatórios para bancos MCA localizados nas GPUs. Isso inclui erros de memória HBM relatados de controladores de memória unificados (UMCs) nas GPUs. Os erros de memória da GPU são tratados como erros de memória da CPU.
Suporte AMD CPU UMC em EDAC podem ser reutilizados para suporte GPU UMC. No entanto, mantê-los separados significa mudanças drásticas em um caminho (por exemplo, para oferecer suporte a produtos mais novos) devem ter menos impacto no outro caminho.”
Isso segue outros recentes patches de kernel do AMD Linux para estender seu driver EDAC para GPUs.
Outro patch na fila antes do Linux 6.5 adiciona mais documentação sobre a enumeração do sistema heterogêneo AMD com CPUs EPYC e GPUs de instinto.
Isso também incluiu outros patches relacionados a este trabalho que foram todos coletados em ramificação ras/core do TIP.git antes da abertura da janela de mesclagem do Linux 6.5 em algumas semanas. É bom ver mais capacidades computacionais heterogêneas do AMD EPYC + Instinct funcionando no kernel Linux principal.