Einige neue Patches für heterogene AMD-Systeme wurden über TIP.git vor dem bevorstehenden Linux 6.5-Kernel-Merge-Fenster in die Warteschlange gestellt. Diese neuesten AMD Linux-Patches konzentrieren sich auf die ordnungsgemäße heterogene Systemaufzählung für AMD-Rechenzentrumssysteme mit dem Instinct MI200 und neueren Beschleunigern.

Der AMD EDAC-Treiber (Error Detection and Correction) wird um Unterstützung für AMD Heterogeneous Family 19h Model 30h-3Fh-Prozessoren erweitert. Die über 300 Zeilen neuen Code Patch erklärt:

“AMD Family 19h Model 30h-3Fh-Systeme können mit AMD MI200 Beschleuniger-/GPU-Geräten verbunden werden, sodass die CPU-und GPU-Datenstrukturen miteinander verbunden sind. In dieser Konfiguration ist die CPU verwaltet die Fehlerprotokollierung und-berichterstattung für MCA-Bänke auf den GPUs. Dazu gehören HBM-Speicherfehler, die von Unified Memory Controllern (UMCs) auf den GPUs gemeldet werden. Die GPU-Speicherfehler werden wie CPU-Speicherfehler behandelt.

AMD CPU UMC-Unterstützung in EDAC können für die GPU-UMC-Unterstützung wiederverwendet werden. Wenn man sie jedoch getrennt hält, sollten drastische Änderungen in einem Pfad (z. B. zur Unterstützung neuerer Produkte) weniger Auswirkungen auf den anderen Pfad haben.“

Dies folgt anderen aktuellen AMD Linux-Kernel-Patches zur Erweiterung ihres EDAC-Treibers für GPUs.
Noch ein Patch, der vor Linux 6.5 in die Warteschlange gestellt wurde, fügt mehr Dokumentation rund um die heterogene AMD-Systemaufzählung mit EPYC-CPUs und hinzu Instinkt-GPUs.
Dazu gehörten auch andere verwandte Patches zu dieser Arbeit, die alle in TIP.gits ras/core-Zweig vor dem Linux 6.5-Merge-Fenster, das in ein paar Wochen geöffnet wird. Es ist gut zu sehen, dass mehr der heterogenen Rechenfunktionen von AMD EPYC + Instinct ihren Weg in den Mainline-Linux-Kernel finden.

Categories: IT Info