英特爾編譯器工程師已經發布了最初的 GCC 和 LLVM/Clang 編譯器補丁,用於在明年的至強可擴展“Granite Rapids”處理器中啟用新公開的 AMX-COMPLEX 擴展。
建立在當前 Xeon 可擴展“Sapphire Rapids”處理器引入的 AMX(高級矩陣擴展)支持的基礎上,在 Emerald Rapids 之後是 Granite Rapids 並引入了 AMX-COMPLEX。
AMX-COMPLEX 用於將復雜分塊累加到打包的單精度分塊中的矩陣乘法。英特爾最近通過最新的編程參考手冊公開了 AMX-COMPLEX 指令集的詳細信息。
這個星期一早上發出的是 GCC 補丁 用於啟用 AMX-COMPLEX TCMMIMFP16PS/TCMMRLFP16PS 指令並使用-march=graniterapids 調整公開它們.雖然 GCC 13 將在未來幾週內發布,但這種新的 AMX-COMPLEX 支持不應危及現有 GCC 的使用和未來的硬件,因此英特爾仍希望將其擠入即將發布的 GCC 13.1 穩定版本中。
與此同時,週日發布了 LLVM 補丁,用於通過該開源編譯器堆棧啟用英特爾 AMX-COMPLEX。 LLVM AMX-COMPLEX 支持仍在審查中。