使用 AMD Ryzen Threadripper 3990X

在最近關於-O3’ing Linux 內核和其他編譯器優化的討論之後,一個請求進來看看一些新的 GCC使用最近發布的 GCC 12 進行編譯器優化基準測試。因此,這裡是通過-Ofast 以及鏈接時間優化 (LTO) 和新 GCC 12 上的“-march=native”調優對各種 GCC 優化級別的全新了解成熟的 AMD Ryzen Threadripper 3990X 平台。

NVIDIA 改進 Linux NUMA 距離接口以提高性能

NVIDIA 工程師一直在研究 Linux 內核中的 NUMA 距離度量,以取代一些驅動程序當前用於 NUMA 感知內存分配的簡單本地/遠程 NUMA 首選項接口。在他們的測試中,這種改進的 NUMA 距離處理對吞吐量和 CPU 利用率產生了“重大的性能影響”…