EPYC 9654 adalah prosesor andalan baru AMD dengan 96 core/192 thread, a Base clock 2.4GHz dengan boost clock 3.7GHz, dan memiliki TDP 360 Watt. TDP yang dapat dikonfigurasi pada bagian inti 96 tunggal ini adalah dari 320 hingga 400 Watt.

Sementara itu EPYC 9554 adalah bagian 64-core tingkat tinggi AMD dibandingkan EPYC 9534. EPYC 9554 memiliki 64 core/128 thread dengan base clock 3.1GHz dan boost clock 3.75GHz sementara memiliki TDP 360 Watt seperti EPYC 9654. Seperti EPYC 9654, cTDP dapat disesuaikan dari 320 hingga 400 Watt. Prosesor andalan Milan saat ini, EPYC 7763, sebagai pengingat adalah 64 core/128 thread dengan clock dasar 2.45GHz dan clock boost maksimum 3.5GHz. Atau di sisi Milan-X adalah EPYC 7773X dengan clock dasar 2.2GHz dan clock boost maksimum 3.5GHz sementara memiliki cache L3 768MB.

AMD EPYC 9374F 32-bagian frekuensi tinggi inti yang muncul dalam tinjauan terpisah memiliki clock dasar 4.05GHz dan peningkatan 4.3GHz sementara memiliki TDP 320 Watt.

EPYC 9654 memiliki harga peluncuran sekitar $11.805, EPYC 9554 akan dijual seharga sekitar $9.087 USD, dan EPYC 9374F sekitar $4.850.

Perbandingan ukuran AMD Milan SP3 di atas AMD Genoa SP5.

AMD dengan baik hati menyediakan platform referensi Titanite dan prosesor EPYC 9004 Genoa untuk tinjauan ini dan benchmark Linux. Untuk tinjauan peluncuran hari ini, prosesor server yang diuji meliputi:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

Semua prosesor ini baru saja diuji/diuji ulang menggunakan Ubuntu 22.10 dengan kernel Linux 6.0 dan GCC 12. Detail selengkapnya tentang tumpukan perangkat lunak di bawah ini.

Untuk prosesor EPYC Genoa baru, saya menguji EPYC 9554 dan 9654 baik dalam mode determinisme”kinerja”default maupun dalam BIOS beralih ke mode determinisme”daya”bagi mereka yang ingin tahu tentang dampak kinerja keseluruhan dari kontrol determinisme dari BIOS. Hasil akhiran”-Power”Genoa adalah saat dijalankan dalam mode determinisme daya di atas determinisme kinerja default. Semua pengaturan BIOS lainnya untuk masing-masing prosesor Intel/AMD yang diuji berada pada default masing-masing. Pengujian 1P dan 2P dilakukan pada semua prosesor yang diuji yang tersedia.

Mengingat”pendarahan”dan fokus berwawasan ke depan yang biasa saya lakukan, semua tolok ukur ini dilakukan dari Ubuntu 22.10 dengan kompiler stok GCC 12.2-nya. Untuk tampilan kernel yang baru, Linux 6.0 sedang digunakan. Tumpukan perangkat lunak yang sama ini digunakan di semua server/prosesor yang diuji. Setiap konfigurasi berjalan dengan memori pada kecepatan pengenal maksimum dan konfigurasi saluran memori. Semua CPU diuji menggunakan gubernur penskalaan frekuensi CPU”kinerja”.

Ubuntu 22.04 LTS juga dalam kondisi yang baik untuk EPYC Genoa dan saya telah menjalankan pengujian prosesor seri EPYC 9004 ini di Ubuntu 22.04 dengan kernel Linux 5.15-nya, tetapi untuk melihat kinerja Linux ke depan dan ingin menggunakan perangkat lunak upstream terbaru, putaran pembandingan ini dilakukan dengan Ubuntu 22.10 + Linux 6.0 di semua prosesor server yang diuji.

Tidak mengherankan, dukungan prosesor AMD EPYC 9004″Genoa”untuk Linux dalam kondisi baik untuk diluncurkan. Menggunakan distribusi dengan kernel Linux versi terbaru (atau distribusi Linux perusahaan dengan kernel back-ported/patched) harus dalam kondisi yang baik untuk prosesor server Zen 4 ini. Ada beberapa fitur yang baru saja mendarat seperti penanganan Last Branch Record yang diperbarui, tetapi semua fungsi utama sudah ada–termasuk pemantauan suhu dan konsumsi daya. Di sisi kompiler, dukungan Zen 4 (znver4) lambat. AMD baru-baru ini memposting patch pengaktifan Znver4 awal mereka sambil membawa tabel biaya dari Znver3. Dukungan awal itu akan ditemukan di GCC 13 yang akan keluar pada bulan-bulan awal tahun depan dan dukungan LLVM/Dentang 16.0 sedang menunggu keputusan. AMD diharapkan segera mengeluarkan rilis AOCC baru untuk Kompiler C/C++ Pengoptimalan AMD mereka dengan optimasi Zen 4.

Selama benchmark, berbagai pilihan benchmark server/HPC dilakukan sambil juga memantau daya CPU konsumsi dari antarmuka RAPL yang terbuka dan menyediakan metrik kinerja-per-Watt per-benchmark dan banyak lagi.

Segera dengan menjalankan beberapa tolok ukur HPC, prosesor AMD EPYC Genoa menunjukkan kehebatan kinerja mereka. AMD EPYC 9654 2P memiliki waktu pengoperasian 40% lebih rendah untuk kode DFT GPAW dibandingkan dengan EPYC 7773X Milan-X dan mendekati titik menjadi hampir dua kali lebih cepat dari prosesor EPYC 7763. Saat beralih ke mode determinisme daya, ada lebih banyak kinerja yang diperas dari prosesor EPYC Genoa. Bukan hanya 96 core versus 64 core yang mengarah ke peningkatan besar dengan Genoa karena kinerja 64-core EPYC 9554 1P2P juga luar biasa–EPYC 9554 menyamai kinerja EPYC 7763 2P untuk GPAW!

Tetapi , tentu saja, prosesor EPYC 9554/9654 baru ini mengkonsumsi lebih banyak daya daripada pendahulunya seperti yang diharapkan.

Berdasarkan kinerja per dolar, prosesor EPYC 9554/9654 yang baru berkinerja cukup baik terhadap bagian generasi sebelumnya. Tentu saja, itu hanya harga CPU tetapi ada juga harga memori DDR5 dan harga platform yang perlu dipertimbangkan, tetapi tidak mungkin untuk membuat penilaian yang akurat di sana sebelum peluncuran dalam melihat bagaimana harga motherboard Genoa, dll, akan dibandingkan to Milan(X).

Kinerja AMD EPYC 9654 dan EPYC 9554 sama-sama luar biasa dengan benchmark dinamika molekul GROMACS. Performa EPYC 9654 2P adalah 1,66x kecepatan EPYC 7773X 2P dan konfigurasi EPYC 9654 1P hampir menyamai performa EPYC 7773X 2P… Ada peningkatan substansial berkat core tambahan, memori sistem DDR5, 12 saluran memori, AVX-512, dan peningkatan arsitektur Zen 4 lainnya. Dan jika dijalankan dalam mode determinisme daya, kinerjanya bahkan lebih tinggi.

Meskipun konsumsi daya EPYC Genoa lebih tinggi dibandingkan dengan EPYC Milan(X) dan Xeon Ice Lake, berdasarkan kinerja-per-Watt untuk GROMACS, efisiensi ditemukan dengan Genoa. Prosesor unggulan Intel Xeon Platinum 8380 sama sekali tidak kompetitif dengan Genoa dan cukup sulit melawan Milan(X) di sebagian besar tolok ukur, tetapi setidaknya Xeon Sapphire Rapids diharapkan akan tiba pada kuartal berikutnya.

Performa-per-metrik dolar berdasarkan harga CPU menempatkan Genoa dalam kondisi yang baik.

Prosesor EPYC Genoa yang teruji berkinerja luar biasa dengan NAMD dan memberikan hasil yang luar biasa dari generasi ke generasi dari Milan/Milan-X dan memperluas keunggulan dibandingkan generasi saat ini Prosesor Xeon Ice Lake.

AMD EPYC Genoa tampil luar biasa dengan benchmark Graph500.

Hasil EPYC 9654/9554 juga mengejutkan untuk benchmark HPCG. Sederhananya, seri AMD EPYC 9004 melalui berbagai macam tolok ukur secara konsisten memberikan peningkatan kinerja yang belum pernah terjadi sebelumnya.

Prosesor EPYC 9554 dan EPYC 9654 menunjukkan kinerja fenomenal dengan prakiraan cuaca menggunakan WRF. Peningkatan dari tidak hanya EPYC 7773X/7763 ke EPYC 9654 sangat mengejutkan tetapi bahkan EPYC 9554 64-core memiliki keuntungan besar berkat AVX-512 dan peningkatan lainnya dibandingkan prosesor server Zen 3 sebelumnya.

Aktif berbasis kinerja per dolar dengan WRF, prosesor EPYC Genoa terus bersinar.

Dengan RELION, peningkatan generasi kurang tetapi masih signifikan dari Milan(X) ke Genoa.

AMG adalah salah satu dari sedikit tolok ukur di mana prosesor Xeon Platinum 8362/8380 Ice Lake dapat mengungguli prosesor andalan EPYC Milan, tetapi itu tidak lagi terjadi pada Genoa.

Meskipun memiliki konsumsi daya yang lebih tinggi, EPYC Prosesor Genoa memberikan efisiensi daya yang luar biasa.

Di berbagai tolok ukur HPC, kinerja prosesor EPYC Genoa sangat fenomenal. Beberapa minggu terakhir menjalankan EPYC Genoa telah menjadi beberapa hasil tolok ukur kinerja paling menarik yang pernah saya lihat selama 18+ tahun terakhir dengan peningkatan generasi yang luar biasa sambil tetap memberikan efisiensi dan nilai daya terdepan.

Di seluruh berbagai macam tolok ukur HPC, konfigurasi EPYC 9654 dan 9554 menawarkan kinerja luar biasa dalam mode determinisme kinerja default.

OpenVINO untuk proyek perangkat lunak AI open-source Intel berkinerja luar biasa pada AMD EPYC 9004″Genoa”prosesor dengan AVX-512. Prosesor Xeon Platinum 8362/8380 menghadirkan kinerja yang lebih baik dibandingkan CPU Milan/Milan-X berkat AVX-512, tetapi implementasi AVX-512 Genoa yang efisien menghasilkan kinerja yang jauh lebih tinggi sekarang dengan OpenVINO.

Peningkatan dengan OpenVINO untuk Genoa begitu dramatis sehingga nilai kinerja per dolar jauh melampaui CPU Intel/AMD yang ada.

OpenVINO adalah benteng untuk Intel Xeon Scalable”Ice Lake”di atas Milan/Milan-X namun prosesor EPYC 9554″Genoa”bahkan bisa bersaing dengan dua prosesor Xeon Platinum 8380. Performa dari Genoa luar biasa.

Dari sekian banyak model berbeda yang diuji, OpenVINO 2022 memiliki performa yang sangat baik dengan prosesor EPYC Genoa berkat dukungan AVX-512. Meskipun awalnya saya khawatir dengan implementasi AVX-512 Zen 4 yang menggunakan jalur data 256-bit, ini telah terbukti bekerja dengan sangat baik dan tanpa implikasi daya/termal dari AVX-512 pada CPU Intel sebelumnya.

Prosesor EPYC Genoa juga berkinerja sangat baik dengan perpustakaan jaringan saraf dalam oneDNN Intel yang mampu memanfaatkan AVX-512 secara ekstensif.

Bahkan untuk pekerjaan”sederhana”seperti kompilasi kode di beberapa pekerjaan untuk memenuhi CPU, kinerja seri AMD EPYC 9004 masih memberikan peningkatan generasi yang cukup besar di atas Milan.

Keunggulan jumlah inti dengan AMD EPYC juga membantu dan merupakan area di mana EPYC Genoa masih akan memimpin atas prosesor Intel Sapphire Rapids yang akan datang.

Prosesor Genoa kelas atas yang baru dapat mengkompilasi kernel default Linux x86_64 dalam waktu kurang dari 20 detik!

Atau membangun kernel lengkap dengan semua modul kernel yang tersedia dapat dilakukan di bawah dua menit.

Berdasarkan kinerja per dolar, hasil EPYC Genoa s sebanding dengan harga Milan saat ini untuk nilai jika tertarik dengan kompilasi kode build farm/server CI.

Untuk render farm berbasis CPU, AMD EPYC Genoa dengan hingga 96 core dan peningkatan desain dibandingkan Zen 3 terbayar dengan peningkatan waktu render yang signifikan. Dengan adegan BMW yang terkenal, prosesor andalan EPYC 9654 2P dapat merendernya hanya dalam 8 detik!

AMD EPYC Genoa berkinerja sangat baik dengan Blender 3.3 dengan peningkatan generasi yang besar dan kinerja yang jauh lebih baik daripada yang bisa dicapai dengan Xeon Scalable Ice Lake dan jumlah inti yang jauh lebih rendah.

Mode determinisme daya dapat membantu waktu render Blender lebih lama lagi, jika Anda tidak keberatan dengan peningkatan daya/dampak termal.

Berdasarkan kinerja per dolar, CPU Genoa yang baru paling tidak sebanding dari segi harga dengan Milan dalam basis CPU.

Kernel ray-tracing Intel Embree dapat mengambil manfaat secara signifikan dari Genoa dengan AVX-512. EPYC 9654 2P dalam mode determinisme daya dua kali lebih cepat dari prosesor AMD EPYC 7773X 2P.

Meskipun prosesor Genoa yang diuji ini memiliki konsumsi daya yang lebih tinggi daripada Milan, pada basis kinerja-per-Watt yang mereka lakukan jauh lebih baik daripada CPU Intel/AMD lainnya.

Genoa berkinerja baik di komponen perangkat lunak Intel lain yang dioptimalkan AVX-512 yang merupakan bagian dari koleksi oneAPI mereka.

OSPRay ray-mesin penelusur memiliki beberapa kemenangan dengan prosesor Xeon Platinum 8380/8662 atas Milan/Milan-X, tetapi hal itu tidak lagi terjadi pada Genoa. Dengan OSPRay yang dioptimalkan dengan baik oleh Intel untuk penggunaan AVX-512 pada CPU Xeon mereka, OSPRay bekerja sama baiknya dengan prosesor server AVX-512 baru AMD.

Untuk beban kerja rendering berbasis CPU, hasil Genoa sangat luar biasa terutama dalam kasus seperti EPYC 9654 tunggal yang mampu mengungguli konfigurasi 2P EPYC 7773X atau 2P 7763.

Dalam tolok ukur Node.js single-threaded, Genoa sekarang dapat melampaui Ice Lake berkat Peningkatan arsitektur Zen 4.

Tolok ukur parsing simdjson JSON biasanya tidak menarik untuk kinerja server besar, tetapi sekarang simdjson memiliki jalur yang dioptimalkan AVX-512. Prosesor seri EPYC 9004 jauh di depan Ice Lake sekarang berkat dukungan Zen 4 AVX-512.

Konsumsi daya juga sebanding dengan Ice Lake dengan CPU yang tidak sepenuhnya jenuh untuk benchmark parsing JSON.

EPYC 9554 memberikan performa-per-Watt terbaik untuk pengujian parsing berkemampuan AVX-512 ini untuk gigabyte data JSON.

Uji performa Python single-threaded juga menunjukkan kemajuan yang bagus dengan Zen 4.

Dan beberapa peningkatan yang sangat bagus untuk Numpy.

Kinerja PHP single-threaded Genoa sekarang dalam kondisi yang hanya sebanding dengan Ice Lake , tetapi untuk server web yang terisi penuh tentu saja ada lebih banyak kapasitas yang dapat ditemukan dengan Genoa dan jumlah inti/utasnya yang lebih tinggi.

Di seluruh beban kerja yang lebih umum seperti kompresi file/data, Zen 4 dengan Genoa memberikan beberapa peningkatan inkremental yang bagus dari Zen 3.

Genoa mengumpulkan beberapa kemenangan luar biasa dengan BRL-CAD.

Ada peningkatan generasi yang signifikan untuk dinikmati y dengan Genoa untuk perangkat lunak pemrosesan sinyal digital open-source Liquid-DSP.

Singkat cerita, dari sekitar 200 tolok ukur berbeda yang saya lakukan, prosesor AMD EPYC 9654 dan EPYC 9554 sukses besar. Mereka memberikan peningkatan generasi yang hebat secara keseluruhan tetapi terutama di banyak beban kerja HPC/server yang dapat memanfaatkan AVX-512 dan pada gilirannya memperluas keunggulan AMD atas prosesor”Ice Lake”Xeon Scalable saat ini.

Hasil OpenFOAM dengan EPYC Genoa sangat fantastis untuk komputasi fluid dynamics (CFD) sumber terbuka.

OpenRadioss Altair juga terlihat sangat bagus di Genoa. (Tidak semua CPU diuji di sini karena penambahan tolok ukur baru itu terlambat ke siklus peninjauan pengujian. Namun mengingat minat dari proyek sumber terbuka baru dari Altrair ini, berikut adalah titik referensi untuk CPU yang diuji.)

VAdz

Mereka yang ingin melihat semua tolok ukur yang saya jalankan secara penuh dapat melakukannya melalui