EPYC 9654 là bộ xử lý hàng đầu mới của AMD với 96 lõi/192 luồng thể thao, một Xung cơ bản 2,4 GHz với xung nhịp tăng 3,7 GHz và có TDP 360 Watt. TDP có thể định cấu hình trên phần lõi 96 duy nhất này là từ 320 đến 400 Watts.

Trong khi đó, EPYC 9554 là phần 64 lõi cấp cao hơn của AMD so với EPYC 9534. EPYC 9554 thể thao 64 lõi/128 luồng với xung nhịp cơ bản 3,1 GHz và xung nhịp tăng 3,75 GHz trong khi có TDP 360 Watt như EPYC 9654. Giống như EPYC 9654, cTDP có thể được điều chỉnh từ 320 đến 400 Watts. Bộ xử lý hàng đầu hiện tại của Milan, EPYC 7763, là 64 lõi/128 luồng với xung nhịp cơ bản 2,45 GHz và xung nhịp tăng tối đa 3,5 GHz. Hoặc ở phía Milan-X là EPYC 7773X với xung nhịp cơ bản 2,2 GHz và xung nhịp tăng tối đa 3,5 GHz trong khi có bộ nhớ đệm L3 768 MB.

AMD EPYC 9374F 32 Phần tần số cao-core sắp xuất hiện trong bài đánh giá riêng biệt của nó có xung nhịp cơ bản là 4,05 GHz và mức tăng 4,3 GHz trong khi có TDP 320 Watt.

EPYC 9654 có giá ra mắt khoảng 11.805 USD, EPYC 9554 sẽ được bán lẻ với giá khoảng 9.087 USD và EPYC 9374F với giá khoảng 4.850 USD.

Một so sánh kích thước của AMD Milan SP3 trên AMD Genoa SP5.

AMD vui lòng cung cấp nền tảng tham chiếu Titanite và bộ xử lý EPYC 9004 Genoa cho bài đánh giá này và điểm chuẩn cho Linux. Đối với bài đánh giá ra mắt hôm nay, các bộ xử lý máy chủ đã thử nghiệm bao gồm:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Tất cả các bộ xử lý này đều được kiểm tra/kiểm tra lại bằng Ubuntu 22.10 với nhân Linux 6.0 và GCC 12. Thêm chi tiết về ngăn xếp phần mềm bên dưới.

Đối với bộ xử lý EPYC Genoa mới, tôi đã thử nghiệm EPYC 9554 và 9654 cả ở chế độ xác định”hiệu suất”mặc định cũng như trong BIOS chuyển sang chế độ xác định”sức mạnh”cho những người tò mò về tác động hiệu suất tổng thể của kiểm soát xác định từ BIOS. Kết quả Genoa hậu tố”-Power”là khi chạy ở chế độ xác định công suất thay vì xác định hiệu suất mặc định. Tất cả các cài đặt BIOS khác cho từng bộ vi xử lý Intel/AMD được thử nghiệm đều ở giá trị mặc định tương ứng. Cả thử nghiệm 1P và 2P đều được thực hiện trên tất cả các bộ vi xử lý đã thử nghiệm hiện có.

Với sự tập trung”lợi hại”và hướng tới tương lai của tôi, tất cả các điểm chuẩn này đều được thực hiện từ Ubuntu 22.10 với trình biên dịch cổ phiếu GCC 12.2 của nó. Để có giao diện hạt nhân mới, Linux 6.0 đã được sử dụng. Cùng một ngăn xếp phần mềm này đã được sử dụng trên tất cả các máy chủ/bộ xử lý được thử nghiệm. Mỗi cấu hình đang chạy với bộ nhớ ở tốc độ định mức tối đa và cấu hình kênh bộ nhớ. Tất cả các CPU đã được kiểm tra bằng cách sử dụng bộ điều chỉnh tỷ lệ tần số CPU”hiệu suất”.

Mặc dù Ubuntu 22.04 LTS cũng đang hoạt động tốt cho EPYC Genoa và tôi đã chạy thử nghiệm các bộ xử lý dòng EPYC 9004 này trên Ubuntu 22.04 với nhân Linux 5.15 của nó, nhưng đối với cái nhìn của tôi về hiệu suất Linux nhìn về phía trước và muốn sử dụng phần mềm ngược dòng mới nhất, vòng đo điểm chuẩn này đã được thực hiện với Ubuntu 22.10 + Linux 6.0 trên tất cả các bộ xử lý máy chủ được thử nghiệm.

Không có gì ngạc nhiên khi bộ xử lý AMD EPYC 9004″Genoa”hỗ trợ cho Linux đang trong tình trạng tốt để ra mắt. Việc sử dụng bản phân phối có phiên bản gần đây của nhân Linux (hoặc bản phân phối Linux dành cho doanh nghiệp với các nhân được chuyển tiếp/vá lỗi) sẽ phù hợp với các bộ xử lý máy chủ Zen 4 này. Có một số tính năng chỉ mới cập nhật gần đây như xử lý Bản ghi Nhánh Cuối cùng được cập nhật, nhưng tất cả các chức năng chính đã có sẵn-bao gồm theo dõi nhiệt độ và mức tiêu thụ điện năng. Về phía trình biên dịch, hỗ trợ Zen 4 (znver4) là chậm. AMD gần đây chỉ đăng bản vá kích hoạt Znver4 ban đầu của họ trong khi chuyển các bảng chi phí từ Znver3. Hỗ trợ ban đầu đó sẽ được tìm thấy trong GCC 13 sẽ ra mắt trong những tháng đầu năm tới và hỗ trợ LLVM/Clang 16.0 đang chờ xử lý. AMD dự kiến ​​sẽ sớm phát hành bản phát hành AOCC mới cho Trình biên dịch C/C ++ AMD Tối ưu hóa của họ với các tính năng tối ưu hóa Zen 4.

Trong quá trình đo điểm chuẩn, nhiều lựa chọn điểm chuẩn của máy chủ/HPC đã được thực hiện đồng thời theo dõi sức mạnh của CPU tiêu thụ từ các giao diện RAPL tiếp xúc và cung cấp các chỉ số hiệu suất trên mỗi Watt theo chuẩn và hơn thế nữa.

Ngay lập tức với việc kích hoạt một số điểm chuẩn HPC, bộ xử lý AMD EPYC Genoa cho thấy sức mạnh của chúng về hiệu suất. AMD EPYC 9654 2P có thời gian chạy mã GPAW DFT thấp hơn 40% so với EPYC 7773X Milan-X và đang tiến gần đến điểm nhanh hơn gần gấp đôi so với bộ xử lý EPYC 7763. Khi chuyển sang chế độ xác định công suất, bộ vi xử lý EPYC Genoa sẽ có nhiều hiệu suất hơn. Nó không chỉ là 96 lõi so với 64 lõi dẫn đến sự cải tiến lớn với Genoa vì hiệu suất 64 lõi EPYC 9554 1P2P cũng rất xuất sắc-EPYC 9554 phù hợp với hiệu suất EPYC 7763 2P cho GPAW!

Nhưng tất nhiên, các bộ xử lý EPYC 9554/9654 mới này tiêu thụ nhiều năng lượng hơn so với các bộ xử lý tiền nhiệm.

Trên cơ sở hiệu suất trên mỗi đô la, bộ xử lý EPYC 9554/9654 mới hoạt động khá tốt chống lại các bộ phận thế hệ trước. Tất nhiên, đó chỉ là giá CPU nhưng cũng có giá bộ nhớ DDR5 và giá nền tảng để xem xét, nhưng không thể đưa ra các đánh giá chính xác ở đó trước khi ra mắt để xem giá bo mạch chủ Genoa, v.v. sẽ so sánh như thế nào đến Milan (X).

Hiệu suất AMD EPYC 9654 và EPYC 9554 cũng xuất sắc như nhau với điểm chuẩn động lực học phân tử GROMACS. Hiệu suất EPYC 9654 2P gấp 1,66 lần tốc độ của EPYC 7773X 2P và cấu hình EPYC 9654 1P gần như phù hợp với hiệu suất EPYC 7773X 2P… Có sự gia tăng đáng kể nhờ vào các lõi bổ sung, bộ nhớ hệ thống DDR5, 12 kênh bộ nhớ, AVX-512, và các cải tiến kiến ​​trúc Zen 4 khác. Và nếu chạy ở chế độ xác định công suất, hiệu suất thậm chí còn cao hơn.

Mặc dù mức tiêu thụ điện của EPYC Genoa cao hơn so với EPYC Milan (X) và Xeon Ice Lake, trên cơ sở hiệu suất trên mỗi Watt đối với GROMACS, hiệu quả được tìm thấy với Genoa. Bộ vi xử lý Xeon Platinum 8380 hàng đầu của Intel chỉ đơn giản là không thể cạnh tranh với Genoa và đã gặp khó khăn khi đối đầu với Milan (X) trong hầu hết các điểm chuẩn, nhưng ít nhất Xeon Sapphire Rapids hy vọng sẽ đến vào quý tới.

Hiệu suất-per-đo lường số liệu dựa trên giá CPU giúp Genoa có tình trạng tốt.

Các bộ xử lý EPYC Genoa đã thử nghiệm đã hoạt động đáng kinh ngạc với NAMD và mang lại kết quả tuyệt vời từ Milan/Milan-X và mở rộng vị trí dẫn đầu so với thế hệ hiện tại Bộ vi xử lý Xeon Ice Lake.

AMD EPYC Genoa hoạt động tuyệt vời với điểm chuẩn Graph500.

Kết quả EPYC 9654/9554 cũng đáng kinh ngạc đối với điểm chuẩn HPCG. Nói một cách đơn giản, dòng AMD EPYC 9004 thông qua nhiều điểm chuẩn đã liên tục mang đến sự nâng cấp hiệu suất chưa từng có.

Bộ xử lý EPYC 9554 và EPYC 9654 thể hiện hiệu suất phi thường với khả năng dự báo thời tiết bằng WRF. Sự gia tăng không chỉ từ EPYC 7773X/7763 lên EPYC 9654 là đáng kinh ngạc mà ngay cả EPYC 9554 64 lõi cũng có lợi thế lớn nhờ AVX-512 và những cải tiến khác so với bộ xử lý máy chủ Zen 3 trước đó.

Bật cơ sở hiệu suất trên mỗi đô la với WRF, bộ xử lý EPYC Genoa tiếp tục tỏa sáng.

Với RELION, sự cải tiến của thế hệ ít hơn nhưng vẫn đáng kể từ Milan (X) đến Genoa.

AMG là một trong số ít điểm chuẩn mà bộ xử lý Xeon Platinum 8362/8380 Ice Lake có thể vượt lên trên các bộ xử lý hàng đầu của EPYC Milan nhưng điều đó không còn xảy ra với Genoa.

Mặc dù có mức tiêu thụ điện năng cao hơn nhưng EPYC Bộ xử lý Genoa mang lại hiệu quả sử dụng điện năng cao.

Trên nhiều tiêu chuẩn của HPC, hiệu suất của bộ xử lý EPYC Genoa đơn giản là một hiện tượng. Vài tuần trước khi chạy EPYC Genoa là một trong những kết quả tiêu chuẩn hiệu suất hấp dẫn nhất mà tôi đã thấy trong hơn 18 năm qua với sự gia tăng đáng kinh ngạc của thế hệ trong khi vẫn mang lại hiệu quả và giá trị điện năng hàng đầu.

nhiều loại điểm chuẩn HPC, cấu hình EPYC 9654 và 9554 mang lại hiệu suất tuyệt vời ở chế độ xác định hiệu suất mặc định.

OpenVINO cho dự án phần mềm AI mã nguồn mở của Intel đã hoạt động tuyệt vời trên AMD EPYC 9004″Genoa”bộ xử lý với AVX-512. Bộ vi xử lý Xeon Platinum 8362/8380 mang lại hiệu suất tốt hơn so với CPU Milan/Milan-X nhờ AVX-512, nhưng việc triển khai AVX-512 hiệu quả của Genoa đã dẫn đến hiệu suất cao hơn nhiều hiện nay với OpenVINO.

Sự cải thiện với OpenVINO cho Genoa ấn tượng đến mức giá trị hiệu suất trên mỗi đô la vượt xa giá trị của các CPU Intel/AMD hiện có.

OpenVINO là thành trì cho Intel Xeon Scalable”Ice Lake”so với Milan/Milan-X nhưng bộ vi xử lý EPYC 9554″Genoa”thậm chí có thể cạnh tranh với hai bộ vi xử lý Xeon Platinum 8380. Hiệu suất của Genoa thật tuyệt vời.

Trên nhiều mô hình khác nhau được thử nghiệm, OpenVINO 2022 đã hoạt động xuất sắc với bộ xử lý EPYC Genoa nhờ hỗ trợ AVX-512. Mặc dù ban đầu tôi lo lắng về việc triển khai AVX-512 của Zen 4 bằng cách sử dụng đường dẫn dữ liệu 256 bit, nhưng nó đã được chứng minh là hoạt động rất tốt và không có tác động về điện/nhiệt của AVX-512 trên các CPU Intel trước đó.

Bộ xử lý EPYC Genoa cũng hoạt động rất tốt với thư viện mạng nơ-ron sâu oneDNN của Intel có thể sử dụng rộng rãi AVX-512.

Ngay cả đối với công việc”đơn giản”như biên dịch mã qua nhiều công việc để bão hòa CPU, hiệu suất dòng AMD EPYC 9004 vẫn mang lại những cải tiến đáng kể cho nhiều thế hệ so với Milan.

Lợi thế về số lượng lõi với AMD EPYC cũng giúp ích và là một lĩnh vực mà EPYC Genoa sẽ vẫn dẫn đầu so với các bộ xử lý Sapphire Rapids sắp tới của Intel.

Các bộ xử lý Genoa cao cấp mới có thể biên dịch bản dựng nhân Linux x86_64 mặc định trong vòng chưa đầy 20 giây!

Hoặc việc xây dựng một nhân đầy đủ với tất cả các mô-đun nhân có sẵn có thể được thực hiện trong hai phút.

Trên cơ sở hiệu suất mỗi đô la, kết quả EPYC Genoa s có thể so sánh với mức giá hiện tại của Milan về giá trị nếu quan tâm đến máy chủ xây dựng/máy chủ CI/trang biên dịch mã.

Đối với các trang trại kết xuất dựa trên CPU, AMD EPYC Genoa với tối đa 96 lõi và cải tiến thiết kế so với Zen 3 đã được đền đáp với những cải tiến đáng kể về thời gian hiển thị. Với bối cảnh nổi tiếng của BMW, bộ xử lý EPYC 9654 2P hàng đầu có thể kết xuất nó chỉ trong 8 giây!

AMD EPYC Genoa đã hoạt động rất tốt với Blender 3.3 với những cải tiến lớn và hiệu suất tốt hơn nhiều so với những gì có thể đạt được với Xeon Scalable Ice Lake và số lượng lõi thấp hơn nhiều của nó.

Chế độ xác định công suất có thể giúp cho thời gian hiển thị của Máy xay sinh tố thậm chí còn nhiều hơn, nếu bạn không bận tâm đến việc tăng công suất/tác động nhiệt.

Trên cơ sở hiệu suất trên mỗi đô la, các CPU Genoa mới có giá rất tương đương với Milan trên cơ sở CPU ít nhất.

Các nhân dò tia Embree của Intel có thể được hưởng lợi đáng kể từ Genoa với AVX-512. EPYC 9654 2P ở chế độ xác định công suất nhanh gấp đôi tốc độ của bộ xử lý AMD EPYC 7773X 2P.

Trong khi các bộ xử lý Genoa này được thử nghiệm có mức tiêu thụ điện năng cao hơn Milan, trên cơ sở hiệu suất trên mỗi Watt mà chúng đang làm tốt hơn nhiều so với các CPU Intel/AMD khác.

Genoa hoạt động tốt trong các thành phần phần mềm Intel được tối ưu hóa AVX-512 khác nằm trong bộ sưu tập oneAPI của họ.

Tia OSPRay-tracing engine đã có một số chiến thắng với bộ vi xử lý Xeon Platinum 8380/8662 so với Milan/Milan-X, nhưng điều đó không còn xảy ra với Genoa. Với việc OSPRay được Intel tối ưu hóa tốt để sử dụng AVX-512 trên CPU Xeon của họ, nó hoạt động tốt ngang với bộ xử lý máy chủ AVX-512 mới của AMD.

Đối với khối lượng công việc hiển thị dựa trên CPU, kết quả Genoa đặc biệt tuyệt vời trong các trường hợp như một EPYC 9654 duy nhất có thể hoạt động tốt hơn cấu hình 2P EPYC 7773X hoặc 2P 7763.

Trong điểm chuẩn Node.js một luồng, Genoa hiện đã có thể vượt lên trên Ice Lake nhờ Các cải tiến về kiến ​​trúc của Zen 4.

Điểm chuẩn phân tích cú pháp simdjson JSON thường không thú vị đối với hiệu suất máy chủ lớn, nhưng hiện tại simdjson có đường dẫn được tối ưu hóa AVX-512. Các bộ xử lý dòng EPYC 9004 hiện nay đã vượt xa Ice Lake nhờ hỗ trợ Zen 4 AVX-512.

Mức tiêu thụ điện năng cũng tương đương với Ice Lake với các CPU không bị bão hòa hoàn toàn đối với điểm chuẩn phân tích cú pháp JSON.

EPYC 9554 đang cung cấp hiệu suất trên mỗi Watt tốt nhất cho bài kiểm tra phân tích cú pháp AVX-512 có khả năng này cho gigabyte dữ liệu JSON.

Các bài kiểm tra hiệu suất Python đơn luồng cũng đã cho thấy những tiến bộ tốt đẹp với Zen 4.

Và một số cải tiến rất tốt cho Numpy.

Hiệu suất PHP đơn luồng của Genoa giờ đây chỉ ở mức tương đương với Ice Lake , nhưng đối với một máy chủ web được tải đầy đủ, tất nhiên có nhiều dung lượng hơn được tìm thấy với Genoa và số lượng lõi/luồng cao hơn của nó.

Trên nhiều khối lượng công việc phổ biến hơn như nén tệp/dữ liệu, Zen 4 với Genoa mang đến một số cải tiến đáng kể so với Zen 3.

Genoa đã thu về một số chiến thắng xuất sắc với BRL-CAD.

y với Genoa cho phần mềm xử lý tín hiệu kỹ thuật số nguồn mở Liquid-DSP.

Tóm lại, từ khoảng 200 điểm chuẩn khác nhau mà tôi đã thực hiện, bộ xử lý AMD EPYC 9654 và EPYC 9554 là một thành công rực rỡ. Nhìn chung, họ đã mang lại sự gia tăng đáng kể cho nhiều thế hệ nhưng đặc biệt là trong nhiều khối lượng công việc HPC/máy chủ có thể tận dụng AVX-512 và lần lượt mở rộng vị trí dẫn đầu của AMD so với các bộ vi xử lý Xeon Scalable”Ice Lake”hiện tại.

Kết quả OpenFOAM với EPYC Genoa rất tuyệt vời đối với động lực học chất lỏng tính toán mã nguồn mở (CFD).

OpenRadioss của Altair cũng đang rất tốt trên Genoa. (Không phải tất cả các CPU đều được thử nghiệm ở đây do việc bổ sung điểm chuẩn mới đó muộn hơn vào chu kỳ đánh giá thử nghiệm. Nhưng với sự quan tâm từ dự án mã nguồn mở mới này của Altrair, đây là những điểm tham chiếu cho các CPU được thử nghiệm.)

Those wishing to see all of the benchmarks I ran in full can do so via xem xét mức tiêu thụ điện năng kết hợp được quan sát cho tất cả các cấu hình bộ xử lý được thử nghiệm trong toàn bộ thời gian thực hiện các điểm chuẩn. Một lần nữa, tất cả các phép đo công suất CPU là từ các giao diện RAPL tiếp xúc trên Linux. EPYC 9554 ở chế độ mặc định (xác định hiệu suất) có mức tiêu thụ điện trung bình là 221 Watts với mức cao nhất là 355 Watts, so với EPYC 7763 với mức trung bình 170 Watt và đỉnh là 286 Watts, nhưng khi bật chế độ xác định công suất thì đã tăng lên mức trung bình 234 Watt với mức cao nhất là 404 Watts. Trong khi đó, EPYC 9654 96 lõi hàng đầu có mức tiêu thụ điện trung bình là 223 Watts và mức cao nhất là 363 Watts, hoặc mức trung bình 256 Watt ở chế độ xác định công suất và mức cao nhất ở đó là 415 Watts. Ở chế độ EPYC 9654 2P là mức trung bình 366 Watt và đỉnh là 697 Watts hoặc ở chế độ xác định công suất trung bình là 443 Watts và mức cao nhất là 833 Watts. Mức tiêu thụ điện năng cao hơn với các bộ vi xử lý Socket SP5 mới này nhưng được thể hiện qua nhiều chỉ số hiệu suất trên mỗi Watt, khi nói đến hiệu suất năng lượng, nó thường đi trước AMD EPYC 7003″Milan”hoặc trường hợp xấu nhất là hiệu suất gần tương tự-per-Watt cho các bộ phận thế hệ trước đó. Vì vậy, việc tăng công suất là hợp lý và cũng có bộ xử lý EPYC 9004″Genoa”thấp hơn nếu không muốn đạt được phạm vi 300 ~ 400 Watt.

Khi lấy giá trị trung bình hình học của tất cả các điểm chuẩn đã chạy thành công tất cả các bộ vi xử lý, đây là cách mọi thứ bắt đầu. Ngay cả một EPYC 9554 duy nhất cũng đi trước cấu hình 2P EPYC 7773X về tổng thể… AMD Thế hệ thứ 4 EPYC thật tuyệt vời với việc triển khai AVX-512, bộ nhớ hệ thống DDR5, mười hai kênh bộ nhớ và các cải tiến kiến ​​trúc Zen 4 khác. EPYC 9554 2P 64 lõi nhanh hơn 64% so với cấu hình 64 lõi EPYC 7763 2P nói chung, hoặc 67% nếu chạy EPYC 9554 2P ở chế độ xác định công suất. Trong khi đó, EPYC 9654 2P hàng đầu nhanh hơn 74% so với EPYC 7763 2P hoặc lên tới 85% khi các CPU hàng đầu của Genoa đang chạy ở chế độ xác định năng lượng. AMD EPYC 9654 2P đang chạy với tốc độ gấp 2 lần so với hàng đầu hiện tại của Intel, bộ vi xử lý Xeon Scalable 8380 2P”Ice Lake”.

Sự phát triển thế hệ từ Milan đến Genoa là đáng kinh ngạc trên một loạt các điểm chuẩn máy chủ và HPC mà tôi đã thực hiện. Bây giờ tôi không còn mơ mộng về việc Genoa-X sẽ trông như thế nào vào năm tới khi biết rằng vẫn còn nhiều tiềm năng hơn để loại bỏ Zen 4 ở phía máy chủ cũng như các CPU Bergamo của năm tới với tối đa 128 lõi để tập trung vào đám mây khối lượng công việc tính toán.

Như tôi đã trình bày rất nhiều về phía máy tính để bàn dòng Ryzen 7000, việc triển khai AVX-512 của AMD Zen 4 hiệu quả đáng kể và điều đó càng đúng hơn ở phía máy chủ. Với việc có nhiều khối lượng công việc phù hợp hơn ở đây có thể sử dụng AVX-512 và một số mức tăng đáng kinh ngạc như được thể hiện trong các tiêu chuẩn này.

Về cơ sở định giá CPU, dòng EPYC 9004 có khả năng cạnh tranh với EPYC 7003 hiện có”Bộ vi xử lý Milan (X)”và bộ xử lý Xeon Scalable Ice Lake. Tuy nhiên, việc chuyển đổi sang Genoa có nghĩa là cũng cần bộ nhớ hệ thống DDR5 ECC đắt hơn DDR4. Tôi chưa nhận được bất kỳ thông tin giá nâng cao nào về bất kỳ bo mạch chủ bán lẻ EPYC Genoa nào vì vậy tôi không chắc điều đó sẽ diễn ra như thế nào nhưng có lẽ với Socket SP5 phức tạp hơn và yêu cầu năng lượng cao hơn, nó sẽ yêu cầu mức giá tương đối cao hơn những gì chúng tôi có được thấy với các bo mạch chủ EPYC SP3. Bộ xử lý EPYC Milan sẽ tiếp tục có sẵn cho những người đang tìm kiếm các máy chủ giá thấp hơn nhưng có hiệu suất vẫn rất tốt.

Về phía hỗ trợ Linux, nhân Linux ngược dòng và các khóa khác các thành phần ở trạng thái tốt để hỗ trợ khi ra mắt với dòng EPYC 9004… Được cho là đúng hơn với thị trường máy chủ Linux ngày nay. Nhưng vẫn còn chỗ cho AMD để đạt được những bước tiến trong hỗ trợ Linux/mã nguồn mở của họ. Ví dụ, AMD đã muộn với các bản vá lỗi IBRS tự động của họ cho nhân Linux khi chỉ đăng những bản vá đó vào tuần trước. Nó cũng chỉ với Linux 6.1, nơi báo cáo bộ nhớ cache và bộ nhớ cache của CPU AMD với perf đang hạ cánh, dành cho những người quan tâm đến khả năng cấu hình mở rộng đó. Ngoài ra, chỉ ra mắt với Linux 6.1 là chức năng Bản ghi Nhánh Cuối cùng của LbrExtV2 mới có trên Zen 4. Trong khi đó, Linux 6.0 đã bỏ xa AMD X2AVIC cho các máy ảo KVM. Vẫn chưa được đề cập chính trong nhân Linux nhưng có sẵn ở dạng vá lỗi là hỗ trợ QoS xung quanh việc phân bổ băng thông bộ nhớ chậm với bộ nhớ CXL và Cấu hình sự kiện giám sát băng thông (BMEC). Vì vậy, có một vài tính năng không quan trọng đã chứng kiến ​​sự xuất hiện muộn đối với nhân Linux dòng chính, nhưng ít nhất về mặt tất cả các hỗ trợ quan trọng, nó đang ở trong tình trạng tốt để khởi chạy. Tất nhiên khi các tính năng đến được mainline thì cũng có thêm thời gian trước khi tìm thấy các hạt nhân này được các bản phân phối Linux khác nhau sử dụng hoặc được chuyển ngược sang các phiên bản hạt nhân doanh nghiệp cho các phiên bản như RHEL và SLES. Một lưu ý tích cực là xu hướng ngược dòng Linux của AMD về thời gian trước khi ra mắt đã được cải thiện cho các thế hệ bộ xử lý EPYC/Zen kế tiếp (phần lớn là do họ đã thuê thêm rất nhiều kỹ sư Linux trong hai năm qua).

Vẫn còn một góc độ đáng tiếc là hỗ trợ điều chỉnh trình biên dịch được cho là muộn cho thế hệ vi xử lý mới này. Chỉ vào giữa tháng 10 khi AMD gửi hỗ trợ trình biên dịch Znver4 của họ cho GCC đã thêm mục tiêu”-march=znver4″và sau đó được hợp nhất vào GCC 13 Git vào cuối tháng 10. Nhưng với sự hỗ trợ ban đầu này, nó sẽ chuyển sang bảng chi phí/điều chỉnh từ Znver3-việc điều chỉnh Znver4 được mong đợi”muộn hơn”. Hy vọng rằng sự hỗ trợ đã được điều chỉnh vẫn sẽ đến kịp thời cho GCC 13, do đó sẽ thấy bản phát hành ổn định của nó là GCC 13.1 vào khoảng tháng 3 ~ tháng 4 năm sau. Nhưng sau đó sẽ không phải cho đến khi hầu hết các bản phân phối Linux H2’2023 như Ubuntu 23.10, nơi GCC 13 được sử dụng làm trình biên dịch hệ thống mặc định. Nếu AMD nhận được hỗ trợ Znver4 của họ vào GCC trước khi ra mắt (giống như Intel được biết đến và đã loại bỏ phần lớn Sapphire Rapids và hỗ trợ AMX cho GCC 12), nó có thể đã được vận chuyển trong Ubuntu 22.04 LTS và các bản phân phối gần đây khác. Ngoài ra còn có một bản vá Znver4 cho GNU Binutils đang nằm trong danh sách gửi thư và khi viết bài này vẫn chưa được hợp nhất.

Hay nói một cách khác, trong bản phát hành trình biên dịch GCC 13 hàng năm nơi AMD chỉ ra mắt hỗ trợ Zen 4 của họ, Intel đã làm việc và hợp nhất để hỗ trợ GCC 13 cho các bộ xử lý 2023 ~ 2024 khác nhau. GCC 13 đã xếp hàng đợi Grand Ridge và Granite Rapids, Meteor Lake, Sierra Forest, và điều đó bao gồm việc kích hoạt các hướng dẫn mới khác nhau đi kèm với các bộ xử lý đó. Đó là loại hỗ trợ kịp thời mà tôi muốn thấy từ AMD (và nhiều năm trước họ đã kịp thời hỗ trợ GCC ban đầu của họ) để vào thời điểm các bộ xử lý này được vận chuyển, hỗ trợ Znver4 lý tưởng sẽ được phát hành/trình biên dịch ổn định được tìm thấy bởi các bản phân phối Linux mới nhất. Kể từ khi viết, chưa có bất kỳ bản vá nào của Znver4 được đăng để xem xét ngược dòng về phía LLVM/Clang trong khi có ít nhất sáu tháng phát hành. Intel tiếp tục dẫn đầu về mặt phần mềm khi nói đến thời gian mã nguồn mở/Linux tuyệt vời của họ trong phần lớn các trường hợp trong nhiều năm qua. Thời gian kích hoạt ngược dòng là một thú cưng định kỳ mà tôi có với AMD mỗi chu kỳ khởi chạy; về phía trình biên dịch, lý do hợp lý duy nhất mà tôi có là họ muốn chơi bài của họ gần với chiếc áo khoác và không tiết lộ các kế hoạch mở rộng ISA mới cho các thế hệ CPU trong tương lai quá sớm.

Được chấp nhận, trừ khi bạn đang tối ưu hóa biên dịch mã cho mục tiêu CPU máy chủ, hỗ trợ trình biên dịch Znver4 này không phải là vấn đề nhiều (hoặc bất kỳ) đối với bạn. Nhưng với sự hấp dẫn ngày càng tăng của AMD trong không gian máy tính hiệu năng cao (HPC), có một chút ngạc nhiên là họ đã không đẩy mạnh hỗ trợ trình biên dịch này sớm hơn. Mặc dù vậy, ít nhất cũng nên sớm có một bản phát hành Trình biên dịch C/C ++ (AOCC) mới của AMD, nơi Zen 4 đang ở trong tình trạng tốt. Khi bản phát hành AOCC mới đó ra mắt, chắc chắn tôi sẽ chạy một số điểm chuẩn của trình biên dịch trên Genoa để xem xét tác động của việc hỗ trợ trình biên dịch đã điều chỉnh đối với các bộ xử lý máy chủ Zen 4 này.

Ngoài hiệu suất tuyệt vời và hỗ trợ Linux để khởi chạy, một khía cạnh thú vị khác của EPYC thế hệ thứ 4 từ phía nền tảng tham chiếu là Titanite chạy với OpenBMC! Thật thú vị khi thấy OpenBMC mã nguồn mở, dựa trên Linux được sử dụng làm ngăn xếp phần mềm cho BMC tham chiếu và hy vọng điều này sẽ mang lại hiệu quả khi thấy OpenBMC được sử dụng bởi nhiều máy chủ EPYC 9004 hơn. Đồng thời, hy vọng mối quan tâm của ngành/khách hàng đối với phần sụn nguồn mở vẫn tiếp tục và AMD có thể tham gia nhiều hơn vào Coreboot và các phần tử phần sụn nguồn mở khác.

Intel Sapphire Rapids chống lại EPYC thế hệ thứ 4 tốt như thế nào. sẽ là một trận chiến thú vị. Sapphire Rapids sẽ chỉ có tối đa 60 lõi so với 96 lõi của Genoa, nhưng lợi thế của Intel là Phần mở rộng ma trận nâng cao mới (AMX), AVX-512 FP16 và nhiều khối gia tốc mới khác nhau. Đối với phần mềm có thể tận dụng AMX và IP bộ tăng tốc của Intel, ít nhất sẽ là một cuộc cạnh tranh rất thú vị với Genoa nhưng đối với khối lượng công việc máy chủ truyền thống hơn sẽ là một thách thức khá lớn-tôi cần nhắc bạn rằng ý nghĩa địa lý trên EPYC 9654 2P là gấp đôi của Xeon Platinum 8380 2P. Cũng sẽ rất thú vị khi xem cách Intel cạnh tranh với dòng EPYC 9004 về giá cả, đặc biệt là với Sapphire Rapids giới thiệu Intel Theo yêu cầu/Silicon do phần mềm xác định.. Một lĩnh vực sẽ rất thú vị đối với Intel với Sapphire Rapids là SKU HBM2e của họ hiện được gọi là Xeon Max trong khi năm sau AMD sẽ có Genoa-X để công bố. Trong số các lợi ích khác của bộ xử lý AMD dòng EPYC thế hệ thứ 4 bao gồm hỗ trợ CXL 1.1+ và hỗ trợ SEV-SNP mở rộng với khả năng mã hóa bộ nhớ tăng lên và nhiều máy ảo hơn.