上個月英特爾開始發布Habana Labs 的 Gaudi2 AI 加速器所需的 Linux 內核驅動程序更改。啟用和隨後的內核審查過程進展順利,硬件支持現在已在即將到來的 Linux 5.20 合併窗口之前排隊到 char-misc 中。
Gaudi2 是用於訓練和推理的第二代 Habana Labs 產品。 Gaudi2 被宣傳為提供兩倍於 NVIDIA A100 硬件的 AI 訓練性能,並具有 96GB 的 HBM2e 內存,是 TPC 的 3 倍,現在採用 7nm 工藝製造,並支持 24 x 100 GbE 網絡。 Gaudi2 的 TDP 為 600 瓦。這是一款令人印象深刻的 AI 硬件,並由開源 Linux 驅動程序支持提供支持。
Gaudi2 建立在與 Gaudi 相同的整體架構之上,因此 Linux“habanalabs”驅動程序啟用並不太具有侵入性——158k 行新代碼中的大部分相當於頭文件。英特爾還發布了針對 Gaudi2 的 TPC_LLVM 編譯器以及內核補丁,並正在努力在用戶空間中發布他們的新 SynapseAI Core 代碼。
Oded Gabbay 一夜之間發送了 此拉取請求,
Gaudi2 已準備好進入主線包括對 Linux 5.20 的 Gaudi2 支持。 Oded 指出,除了網絡位之外,所有 Gaudi2 功能都與此驅動程序代碼相關聯。
由於啟用了 Gaudi2,Habana Labs 驅動程序對下一個內核合併窗口的拉取請求有 159,385 次插入和 1164 次刪除。在本月晚些時候開放的 5.20 合併窗口之前,Greg KH 已經將這些驅動程序更改拉入 char-misc。英特爾還於 5 月宣布了 Habana Labs Greco,但其 Linux 內核支持尚未準備就緒。