Mặc dù Intel đã nghiên cứu hỗ trợ Sapphire Rapids cho Linux từ nhiều năm trước và cho các thành phần quan trọng khác như GCC và LLVM/Clang để mang lại trải nghiệm tốt khi ra mắt với bộ xử lý Xeon có thể mở rộng thế hệ thứ 4, một chút mà họ đã không bình phương bỏ đi trước khi ra mắt là trạng thái nhàn rỗi C0.x mới. Các trạng thái không hoạt động mới này giữa POLL và C1 cho phép kết hợp độ trễ thấp và tiết kiệm năng lượng tốt hơn so với POLL.
Các kỹ sư của Intel đã làm việc trên các bản vá Linux cho các trạng thái không hoạt động C0.1 và C0.2 này trong vài tháng nay để giúp tăng hiệu quả sử dụng năng lượng của bộ xử lý Sapphire Rapids mới. Công việc này đi cùng với các bản vá đang chờ xử lý khác để giúp tăng hiệu suất máy ảo trong điều kiện sử dụng nhiều I/O.
Vào thứ Bảy, phiên bản thứ ba của hỗ trợ trạng thái nhàn rỗi Sapphire Rapids C0.x đã được xuất bản. Thư giới thiệu bản vá tóm tắt công việc một cách tao nhã như sau:
“Trạng thái không hoạt động giúp giảm mức tiêu thụ điện năng khi CPU không có việc gì để làm. Trạng thái không hoạt động của CPU nông nhất là”POLL”. Trạng thái này có độ trễ đánh thức thấp nhất, nhưng tiết kiệm ít năng lượng. Trạng thái không hoạt động tiếp theo trên nền tảng Intel là”C1″. Trạng thái này có độ trễ cao hơn nhưng tiết kiệm nhiều năng lượng hơn”POLL”.
Sapphire Rapids Xeons thêm các trạng thái không hoạt động C0.1 và C0.2 mới giúp về mặt khái niệm nằm giữa”POLL”và”C1″. Những điểm này cung cấp một điểm giữa rất hấp dẫn: độ trễ đánh thức gần bằng POLL và mức tiêu thụ điện năng ở giữa”POLL”và”C1″.
Nói cách khác, chúng tôi mong muốn tất cả, trừ những người dùng nhạy cảm với độ trễ nhất, sẽ thích những trạng thái không hoạt động này hơn POLL.
Bộ bản vá này cho phép hỗ trợ trạng thái không hoạt động của C0.2 trên Sapphire Rapids Xeon (sau này-SPR). Trạng thái không hoạt động mới được thêm vào giữa POLL và C1.”
Với lần lặp lại thứ ba này là một số thay đổi kỹ thuật nhỏ vì mã mới này hoạt động đối với nhân chính.
Với quá trình thử nghiệm các bản vá lỗi mới của Intel, nguồn AC đã giảm 13% và nguồn CPU RAPL giảm 18% khi so sánh phần trăm thay đổi từ POLL sang C0.2. Trong khi đó, việc có C0.2 cũng cho điểm Hackbench cải thiện khoảng 4% cho 4 nhóm. Với các bản vá, trạng thái C0.2 cũng có thể bị vô hiệu hóa nếu muốn thông qua tùy chọn kernel”intel_idle.states_off=2″.
Công việc thú vị và hy vọng mã này sẽ sớm được đưa vào dòng chính–có khả năng ngay cả đối với phiên bản 6.5 nếu mọi thứ đều ổn trong phiên bản thứ ba này của các bản vá lỗi. Hiện tại, bạn có thể tìm thấy tác phẩm trên danh sách linux-pm. Sau khi nó được chọn bởi đường dây chính, tôi chắc chắn sẽ chạy một số điểm chuẩn.