Microsoft é sinônimo de computação em nuvem com sua tecnologia de servidor Azure em várias empresas globalmente. Atualmente, a empresa utiliza GPUs de data center da AMD e Linux em seus servidores. No entanto, quando uma nova GPU precisa ser substituída ou instalada em seus servidores, ela exige que o servidor desligue para trocar as unidades da placa gráfica.
Um driver específico para a tecnologia de desagregação de GPU, destinado a placas gráficas AMD, recebe assistência de engenheiros da Microsoft
A Microsoft criou um driver exclusivo para permitir”hot-plugging”para as GPUs AMD em seus servidores Linux para iniciar essas substituições. Hot-plugging é quando uma placa gráfica pode ser removida do conector PCIe e substituída por outra enquanto o sistema está ativo.
Soquete AMD SP5 retratado em toda a sua glória, LGA 6096 para futuras CPUs EPYC com 96 núcleos & Acima
Shuotao Xu, um engenheiro do grupo Microsoft Research, postou a solicitação abaixo para uma revisão de código para suporte a AMDGPU Hotplug. O patch está preparado para uso em sistemas operacionais Linux. Ele é focado nos sistemas Microsoft Azure para auxiliar na capacidade de aceleradores baseados em GPU hot-plug, caso haja necessidade. O grupo Microsoft Research fez uma solicitação semelhante no GitHub, que os leitores podem encontrar aqui.
Prezados colegas da AMD,
Somos da Microsoft Research e estamos trabalhando na tecnologia de desagregação de GPU.
Criamos um patch contra https://gitlab.freedesktop.org/agd5f/linux.git contra drm-staging-drm-next, que habilitará suporte a hot-plug PCIe para amdgpu
Também criamos uma solicitação pull Adicionar suporte a hotplug PCIe para amdgpu por xushuotao · Pull Request #131 · RadeonOpenCompute/ROCK-Kernel-Driver (github.com)< https://nam06.safelinks.protection.outlook.com/?url=https%3A%2F%2Fgithub.com%2FRadeonOpenCompute%2FROCK-Kernel-Driver%2Fpull%2F131&data=04%7C01%7Cshuotaoxu%40mic rosoft.com% 7Cc86224bc365f44bec6b408da172ecac1% 7C72f988bf86f141af91ab2d7cd011db47% 7C1% 7C0% 7C637847787066456985% 7CUnknown% 7CTWFpbGZsb3d8eyJWIjoiMC4wLjAwMDAiLCJQIjoiV2luMzIiLCJBTiI6Ik1haWwiLCJXVCI6Mn0% 3D% 7C3000 & sdata=PA8l7Cj82dphBHbo82zqTEQUM4kGM7yg5UeQuduhDg0% 3D & reservados=0 > em ROCK-Kernel-Driver, contra ROCM-5.0.x.
Acreditamos que o suporte de dispositivos hot-plug de GPU pode abrir portas para muitos aplicativos avançados em data center nos próximos anos, e gostaríamos de ter alguns revisores sobre este PR para que possamos continuar discussões técnicas sobre esse recurso.
Você poderia ajudar a revisar este patch?
Muito obrigado!
Atenciosamente,
Shuotao Xu
— O solicitação de revisão de código para suporte a AMDGPU Hotplug
Há poucas informações da Microsoft sobre a nova tecnologia de desagregação de GPU. No entanto, como o driver é proprietário da Microsoft, destina-se a permitir que os sistemas Azure incluam aceleração de GPU em seus servidores que ainda precisam instalar uma placa gráfica. Com servidores trabalhando mais do que máquinas de consumo, a capacidade de suporte hot-plug para GPUs seria uma ferramenta significativamente útil.
Placas gráficas e aceleradores hot-plugging através do conector PCIe é um novo conceito. A conexão a quente inicial é usada em alguns sistemas de consumo, como a caixa eGFX, que permite que uma placa AMD seja conectada a uma conexão Thunderbolt 3. Os servidores ainda precisam ver essa funcionalidade. Com data centers cada vez mais predominantes no mercado, essa nova tecnologia beneficiaria a Microsoft com seus sistemas Azure, AMD e linhas de GPU da empresa.
Fonte: Freedesktop.org, GitHub