除了昨天為 AMD Zen 4 客戶端 CPU 帶來 EDAC 支持之外,Linux 6.5 內核的 RAS“可靠性、可用性和可服務性”更新集還分別帶來了初始 GPU/加速器支持。
這是過去幾個月中一直在開發的代碼,用於擴展數據中心 GPU 的 Linux EDAC 驅動程序。特別是,讓 AMD64 錯誤檢測和糾正驅動程序適用於具有 HBM 的 AMD Instinct MI200 GPU。
昨天針對 Linux 發出的 RAS Pull 請求 6.5 解釋:
“添加對 AMD 服務器 GPU (MI200) 上的 RAS 硬件的初始支持。這些 GPU 和 CPU 通過相干結構連接在一起,GPU 內存控制器通過 x86 的 MCA 報告錯誤,因此 EDAC 需要支持它們。amd64_edac 驅動程序現在支持 HBM(高帶寬內存),從而支持此類異構內存控制器系統。”
該代碼現已合併到 Linux 6.5。雖然最初的重點是 MI200 系列,但對於即將推出的 AMD Instinct MI300 系列也很重要。