Os engenheiros da NVIDIA estão trabalhando em Métricas de distância NUMA no kernel do Linux para substituir a interface de preferência NUMA local/remoto simples atualmente usada por alguns drivers para alocações de memória com reconhecimento de NUMA. Em seus testes, essa manipulação de distância NUMA aprimorada está levando a”implicações significativas de desempenho”para taxa de transferência e utilização da CPU.

Este trabalho da NVIDIA não faz parte do esforço do driver gráfico, mas sim do lado da rede Mellanox da casa. Tariq Toukan resumiu na última versão desses patches do kernel:

Implemente e exponha a API de propagação de CPU com base no sched_numa_find_closest() do agendador. Use-o em drivers de dispositivo mlx5 e enic. Isso substitui a preferência NUMA binária (local/remoto) por uma aprimorada que considera as distâncias reais, de modo que NUMAs remotos com curta distância sejam preferidos em relação aos mais distantes.

Isso tem implicações significativas no desempenho ao usar alocações de memória com reconhecimento de NUMA, melhorando o rendimento e a utilização da CPU.

Até agora, os resultados com os drivers de rede Mellanox e ENIC parecem muito bons de Testes da NVIDIA em servidores AMD EPYC 7763:
Veja esta série de patches para mais detalhes.

Categories: IT Info