EPYC 9654 ialah pemproses perdana baharu AMD dengan 96 teras/utas 192 sport Jam asas 2.4GHz dengan jam rangsangan 3.7GHz, dan mempunyai TDP 360 Watt. TDP boleh dikonfigurasikan pada bahagian teras 96 tunggal ini ialah dari 320 hingga 400 Watt.
Sementara itu EPYC 9554 ialah bahagian 64 teras peringkat tinggi AMD berbanding EPYC 9534. EPYC 9554 menggunakan 64 teras/128 benang dengan jam asas 3.1GHz dan jam rangsangan 3.75GHz sambil mempunyai TDP 360 Watt seperti EPYC 9654. Seperti EPYC 9654, cTDP boleh dilaraskan daripada 320 hingga 400 Watt. Pemproses utama Milan semasa, EPYC 7763, sebagai peringatan ialah 64 teras/128 benang dengan jam asas 2.45GHz dan jam rangsangan maksimum 3.5GHz. Atau di sebelah Milan-X ialah EPYC 7773X dengan jam asas 2.2GHz dan jam rangsangan maksimum 3.5GHz sambil mempunyai cache L3 768MB.
AMD EPYC 9374F 32 bahagian frekuensi tinggi teras yang muncul dalam ulasan berasingan mempunyai jam asas 4.05GHz dan rangsangan 4.3GHz sambil mempunyai TDP 320 Watt.
EPYC 9654 mempunyai harga pelancaran sekitar $11,805, EPYC 9554 akan dijual pada harga sekitar $9,087 USD, dan EPYC 9374F sekitar $4,850.
Perbandingan saiz AMD Milan SP3 di atas AMD Genoa SP5.
AMD dengan hormatnya menyediakan platform rujukan Titanite dan pemproses EPYC 9004 Genoa untuk semakan ini dan penanda aras Linux. Untuk semakan pelancaran hari ini, pemproses pelayan yang diuji termasuk:
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654
-EPYC 965
2
br>-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Semua pemproses ini baru diuji/diuji semula menggunakan Ubuntu 22.10 dengan kernel Linux 6.0 dan GCC 12. Butiran lanjut tentang timbunan perisian di bawah.
Untuk pemproses EPYC Genoa baharu saya menguji EPYC 9554 dan 9654 kedua-duanya dalam mod penentuan”prestasi”lalai dan juga dalam BIOS beralih kepada mod determinisme”kuasa”bagi mereka yang ingin tahu tentang kesan prestasi keseluruhan kawalan determinisme daripada BIOS. Hasil akhiran”-Kuasa”Genoa adalah apabila dijalankan dalam mod penentuan kuasa berbanding penentuan prestasi lalai. Semua tetapan BIOS lain untuk setiap pemproses Intel/AMD yang diuji berada pada lalai masing-masing. Kedua-dua ujian 1P dan 2P telah dijalankan ke atas semua pemproses yang diuji yang tersedia.
Memandangkan”kelebihan pendarahan”biasa saya dan fokus berpandangan ke hadapan, semua penanda aras ini telah dijalankan daripada Ubuntu 22.10 dengan pengkompil stok GCC 12.2. Untuk rupa kernel yang segar, Linux 6.0 telah digunakan. Tindanan perisian yang sama ini digunakan merentas semua pelayan/pemproses yang diuji. Setiap konfigurasi berjalan dengan memori pada kelajuan terkadar maksimum dan konfigurasi saluran memori. Semua CPU telah diuji menggunakan gabenor penskalaan frekuensi CPU”prestasi”.
Ubuntu 22.04 LTS walaupun dalam keadaan baik untuk EPYC Genoa juga dan saya telah menjalankan ujian pemproses siri EPYC 9004 ini pada Ubuntu 22.04 dengan kernel Linux 5.15, tetapi untuk melihat prestasi Linux saya melihat ke hadapan dan ingin menggunakan perisian huluan yang terkini, pusingan penandaarasan ini dilakukan dengan Ubuntu 22.10 + Linux 6.0 merentas semua pemproses pelayan yang diuji.
Tidak mengejutkan, sokongan pemproses AMD EPYC 9004″Genoa”untuk Linux berada dalam keadaan yang baik untuk dilancarkan. Menggunakan pengedaran dengan versi terbaharu kernel Linux (atau pengedaran Linux perusahaan dengan kernel yang dialihkan ke belakang/tampalan) harus berada dalam keadaan yang baik untuk pemproses pelayan Zen 4 ini. Terdapat beberapa ciri yang hanya mendarat baru-baru ini seperti pengendalian Rekod Cawangan Terakhir yang dikemas kini, tetapi semua fungsi utama sudah tersedia–termasuk pemantauan suhu dan penggunaan kuasa. Pada bahagian pengkompil, sokongan Zen 4 (znver4) lambat. AMD baru-baru ini menyiarkan tampung pembolehan Znver4 awal mereka sambil membawa jadual kos daripada Znver3. Sokongan awal itu akan ditemui dalam GCC 13 yang akan dikeluarkan pada bulan-bulan awal tahun depan dan sokongan LLVM/Clang 16.0 belum selesai. AMD dijangka mengeluarkan keluaran AOCC baharu tidak lama lagi untuk Pengkompil AMD Optimizing C/C++ mereka dengan pengoptimuman Zen 4.
Semasa penanda aras, pelbagai pilihan penanda aras pelayan/HPC telah dijalankan sambil memantau kuasa CPU. penggunaan daripada antara muka RAPL terdedah dan menyediakan metrik prestasi per-Watt setiap penanda aras dan banyak lagi.
Sejurus selepas melancarkan beberapa penanda aras HPC, pemproses AMD EPYC Genoa menunjukkan kehebatan mereka untuk prestasi. AMD EPYC 9654 2P mempunyai masa larian 40% lebih rendah untuk kod DFT GPAW berbanding EPYC 7773X Milan-X dan menghampiri tahap hampir dua kali lebih pantas daripada pemproses EPYC 7763. Apabila beralih kepada mod penentuan kuasa, terdapat lebih banyak prestasi yang diperah daripada pemproses EPYC Genoa. Bukan sahaja 96 teras berbanding 64 teras yang membawa kepada peningkatan besar dengan Genoa kerana prestasi EPYC 9554 1P2P 64-teras juga cemerlang–EPYC 9554 sepadan dengan prestasi EPYC 7763 2P untuk GPAW!
Tetapi , sudah tentu, pemproses EPYC 9554/9654 baharu ini menggunakan lebih banyak kuasa daripada pendahulunya seperti yang dijangkakan.
Berdasarkan asas prestasi setiap dolar, pemproses EPYC 9554/9654 baharu berprestasi agak baik terhadap bahagian generasi terdahulu. Sudah tentu, itu hanya harga CPU tetapi terdapat juga harga memori DDR5 dan harga platform untuk dipertimbangkan, tetapi tidak mungkin untuk menghasilkan penilaian yang tepat di sana sebelum pelancaran untuk melihat bagaimana harga motherboard Genoa, dll, akan dibandingkan ke Milan(X).
Prestasi AMD EPYC 9654 dan EPYC 9554 adalah sama cemerlang dengan penanda aras dinamik molekul GROMACS. Prestasi EPYC 9654 2P adalah 1.66x kelajuan EPYC 7773X 2P dan konfigurasi EPYC 9654 1P hampir menyamai prestasi EPYC 7773X 2P… Terdapat peningkatan yang ketara berkat teras tambahan, memori sistem DDR5, memori saluran 12 AVX-512, dan penambahbaikan seni bina Zen 4 yang lain. Dan jika berjalan dalam mod penentuan kuasa, prestasi yang lebih tinggi lagi.
Walaupun penggunaan kuasa EPYC Genoa lebih tinggi berbanding dengan EPYC Milan(X) dan Tasik Ais Xeon, berdasarkan prestasi setiap Watt untuk GROMACS, kecekapan didapati dengan Genoa. Pemproses utama Xeon Platinum 8380 Intel tidak bersaing dengan Genoa dan mempunyai masa yang cukup sukar untuk bersaing dengan Milan(X) dalam kebanyakan penanda aras, tetapi sekurang-kurangnya Xeon Sapphire Rapids diharapkan akan tiba pada suku tahun hadapan.
Prestasi-per-metrik dolar berdasarkan harga CPU meletakkan Genoa dalam keadaan yang baik.
Pemproses EPYC Genoa yang diuji menunjukkan prestasi yang luar biasa dengan NAMD dan menyampaikan hasil yang hebat secara turun-temurun dari Milan/Milan-X dan meluaskan peneraju ke atas generasi semasa Pemproses Xeon Ice Lake.
AMD EPYC Genoa menunjukkan prestasi yang hebat dengan penanda aras Graph500.
Keputusan EPYC 9654/9554 juga mengejutkan untuk penanda aras HPCG. Ringkasnya, siri AMD EPYC 9004 melalui pelbagai jenis penanda aras secara konsisten menyampaikan peningkatan prestasi yang tidak pernah berlaku sebelum ini.
Pemproses EPYC 9554 dan EPYC 9654 mempamerkan prestasi yang luar biasa dengan ramalan cuaca menggunakan WRF. Peningkatan bukan sahaja daripada EPYC 7773X/7763 kepada EPYC 9654 adalah mengejutkan malah EPYC 9554 64-teras juga mempunyai kelebihan yang besar terima kasih kepada AVX-512 dan penambahbaikan lain berbanding pemproses pelayan Zen 3 sebelumnya.
Pada berasaskan prestasi setiap dolar dengan WRF, pemproses EPYC Genoa terus bersinar.
Dengan RELION peningkatan generasi adalah kurang tetapi masih ketara dari Milan(X) ke Genoa.
AMG adalah salah satu daripada beberapa penanda aras di mana pemproses Xeon Platinum 8362/8380 Ice Lake boleh mendahului pemproses utama EPYC Milan tetapi itu tidak lagi berlaku dengan Genoa.
Walaupun mempunyai penggunaan kuasa yang lebih tinggi, EPYC Pemproses Genoa telah memberikan kecekapan kuasa yang hebat.
Merentasi pelbagai penanda aras HPC, prestasi pemproses EPYC Genoa sememangnya luar biasa. Beberapa minggu lalu menjalankan EPYC Genoa merupakan antara hasil penanda aras prestasi paling menarik yang pernah saya lihat sejak 18+ tahun lalu dengan peningkatan generasi yang luar biasa sambil masih memberikan kecekapan dan nilai kuasa terkemuka.
Merentasi pelbagai jenis penanda aras HPC, konfigurasi EPYC 9654 dan 9554 menawarkan prestasi hebat dalam mod penentuan prestasi lalai.
OpenVINO untuk projek perisian AI sumber terbuka Intel menunjukkan prestasi yang hebat pada AMD EPYC 9004″Genoa”pemproses dengan AVX-512. Pemproses Xeon Platinum 8362/8380 memberikan prestasi yang lebih baik berbanding CPU Milan/Milan-X berkat AVX-512, tetapi pelaksanaan AVX-512 Genoa yang cekap membawa kepada prestasi yang jauh lebih tinggi sekarang dengan OpenVINO.
Peningkatan dengan OpenVINO untuk Genoa begitu dramatik sehingga nilai prestasi setiap dolar jauh melebihi nilai CPU Intel/AMD sedia ada.
OpenVINO ialah kubu kuat untuk”Tasik Ais”Berskala Intel Xeon berbanding Milan/Milan-X tetapi pemproses EPYC 9554″Genoa”malah boleh bersaing dengan dua pemproses Xeon Platinum 8380. Prestasi Genoa sungguh menakjubkan.
Merentasi banyak model berbeza yang diuji, OpenVINO 2022 menunjukkan prestasi cemerlang dengan pemproses EPYC Genoa berkat sokongan AVX-512. Walaupun pada mulanya saya bimbang dengan pelaksanaan AVX-512 Zen 4 menggunakan laluan data 256-bit, ia telah terbukti berfungsi dengan baik dan tanpa implikasi kuasa/terma AVX-512 pada CPU Intel terdahulu.
Pemproses EPYC Genoa juga menunjukkan prestasi yang sangat baik dengan pustaka rangkaian saraf dalam oneDNN Intel yang mampu menggunakan AVX-512 secara meluas.
Walaupun untuk kerja”mudah”seperti penyusunan kod merentas berbilang kerja untuk memenuhi CPU, prestasi siri AMD EPYC 9004 masih memberikan peningkatan generasi yang besar ke atas Milan.
Kelebihan kiraan teras dengan AMD EPYC juga membantu dan merupakan kawasan di mana EPYC Genoa masih akan menerajui pemproses Sapphire Rapids Intel yang akan datang.
Pemproses Genoa mewah baharu boleh menyusun binaan kernel Linux x86_64 lalai dalam masa kurang daripada 20 saat!
Atau membina kernel penuh dengan semua modul kernel yang tersedia boleh dilakukan di bawah dua minit.
Pada asas prestasi setiap dolar, keputusan EPYC Genoa s adalah setanding dengan harga Milan semasa untuk nilai jika berminat dengan kod kompilasi binaan ladang/pelayan CI.
Untuk ladang render berasaskan CPU, AMD EPYC Genoa dengan sehingga 96 teras dan penambahbaikan reka bentuk berbanding Zen 3 telah membuahkan hasil dengan peningkatan masa pemaparan yang ketara. Dengan pemandangan BMW yang terkenal, pemproses EPYC 9654 2P perdana boleh menghasilkannya dalam masa 8 saat sahaja!
AMD EPYC Genoa menunjukkan prestasi yang sangat baik dengan Blender 3.3 dengan peningkatan generasi yang besar dan prestasi yang jauh lebih baik daripada apa yang boleh boleh dicapai dengan Tasik Ais Boleh Skala Xeon dan kiraan terasnya yang jauh lebih rendah.
Mod penentuan kuasa boleh membantu dengan masa pemaparan Blender dengan lebih banyak lagi, jika anda tidak kisah peningkatan kuasa/impak terma.
Pada asas prestasi setiap dolar, CPU Genoa baharu adalah sangat setanding dari segi harga dengan Milan pada asas CPU sekurang-kurangnya.
Inti pengesanan sinar Embree Intel boleh mendapat manfaat dengan ketara daripada Genoa dengan AVX-512. EPYC 9654 2P dalam mod penentuan kuasa adalah dua kali ganda kelajuan pemproses AMD EPYC 7773X 2P.
Walaupun pemproses Genoa yang diuji ini mempunyai penggunaan kuasa yang lebih tinggi daripada Milan, berdasarkan prestasi setiap Watt yang mereka lakukan jauh lebih baik daripada CPU Intel/AMD yang lain.
Genoa menunjukkan prestasi yang baik dalam komponen perisian Intel yang dioptimumkan AVX-512 yang lain yang merupakan sebahagian daripada koleksi oneAPI mereka.
Sinar OSPRay-enjin pengesanan mempunyai beberapa kemenangan dengan pemproses Xeon Platinum 8380/8662 ke atas Milan/Milan-X, tetapi itu tidak lagi berlaku dengan Genoa. Dengan OSPRay dioptimumkan dengan baik oleh Intel untuk penggunaan AVX-512 pada CPU Xeon mereka, ia berfungsi dengan baik dengan pemproses pelayan AVX-512 baharu AMD.
Untuk beban kerja pemaparan berasaskan CPU, hasil Genoa sangat hebat terutamanya dalam kes seperti EPYC 9654 tunggal dapat mengatasi konfigurasi 2P EPYC 7773X atau 2P 7763.
Dalam penanda aras Node.js satu benang, Genoa kini dapat mendahului Tasik Ais berkat Penambahbaikan seni bina Zen 4.
Tanda aras penghuraian JSON simdjson biasanya tidak menarik untuk prestasi pelayan yang besar, tetapi kini simdjson mempunyai laluan yang dioptimumkan AVX-512. Pemproses siri EPYC 9004 berada jauh di hadapan Tasik Ais kini berkat sokongan Zen 4 AVX-512.
Penggunaan kuasa juga setanding dengan Tasik Ais dengan CPU tidak tepu sepenuhnya untuk penanda aras parsing JSON.
EPYC 9554 telah menyampaikan prestasi-per-Watt terbaik untuk ujian penghuraian berkemampuan AVX-512 ini untuk gigabait data JSON.
Ujian prestasi Python berbenang tunggal juga menunjukkan kemajuan yang bagus dengan Zen 4.
Dan beberapa peningkatan yang sangat baik untuk Numpy.
Prestasi PHP satu benang Genoa kini berada dalam keadaan yang hanya setanding dengan Tasik Ais , tetapi untuk pelayan web yang dimuatkan sepenuhnya sudah tentu terdapat lebih banyak kapasiti untuk ditemui dengan Genoa dan kiraan teras/benangnya yang lebih tinggi.
Merentas beban kerja yang lebih biasa seperti pemampatan fail/data, Zen 4 dengan Genoa memberikan beberapa penambahbaikan tambahan yang bagus berbanding Zen 3.
Genoa mengumpul beberapa kemenangan cemerlang dengan BRL-CAD.
Terdapat peningkatan generasi yang ketara untuk dinikmati y dengan Genoa untuk perisian pemprosesan isyarat digital sumber terbuka Liquid-DSP.
Pendek cerita, daripada kira-kira 200 penanda aras berbeza yang saya jalankan, pemproses AMD EPYC 9654 dan EPYC 9554 adalah satu kejayaan yang memberangsangkan. Mereka menyampaikan peningkatan generasi yang hebat secara keseluruhan tetapi terutamanya dalam banyak beban kerja HPC/pelayan yang dapat memanfaatkan AVX-512 dan seterusnya meluaskan pendahulu AMD ke atas pemproses”Ice Lake”Xeon Scalable semasa.
Hasil OpenFOAM dengan EPYC Genoa adalah hebat untuk dinamik bendalir pengiraan sumber terbuka (CFD).
OpenRadioss Altair juga kelihatan sangat bagus di Genoa. (Bukan semua CPU diuji di sini kerana menambah penanda aras baharu itu lewat pada kitaran semakan ujian. Tetapi memandangkan minat daripada projek sumber terbuka baharu daripada Altrair ini, berikut ialah titik rujukan untuk CPU yang diuji.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Di atas ialah melihat gabungan penggunaan kuasa yang diperhatikan untuk semua konfigurasi pemproses yang sedang diuji untuk keseluruhan tempoh penanda aras yang dijalankan. Sekali lagi, semua ukuran kuasa CPU adalah daripada antara muka RAPL terdedah pada Linux. EPYC 9554 dalam mod lalainya (penentuan prestasi) mempunyai cabutan kuasa purata 221 Watt dengan puncak 355 Watt, berbanding EPYC 7763 dengan purata 170 Watt dan puncak 286 Watt, tetapi apabila mendayakan mod penentuan kuasa ia melonjak kepada purata 234 Watt dengan puncak 404 Watt. Sementara itu, 96-teras utama EPYC 9654 mempunyai cabutan kuasa purata 223 Watts dan kemuncak 363 Watts, atau purata 256 Watt dalam mod penentuan kuasa dan puncaknya ialah 415 Watts. Dalam mod EPYC 9654 2P iaitu purata 366 Watt dan puncak 697 Watt atau dalam mod penentuan kuasa purata 443 Watt dan puncak 833 Watt. Penggunaan kuasa lebih tinggi dengan pemproses Socket SP5 baharu ini tetapi seperti yang ditunjukkan oleh kebanyakan metrik prestasi setiap Watt, apabila bercakap mengenai kecekapan kuasa ia selalunya mendahului AMD EPYC 7003″Milan”atau kes paling teruk adalah prestasi yang hampir serupa-per-Watt kepada bahagian generasi terdahulu tersebut. Jadi peningkatan kuasa adalah wajar dan terdapat pemproses EPYC 9004″Genoa”yang lebih rendah juga jika tidak mahu masuk ke julat 300~400 Watt.
Apabila mengambil min geometri semua penanda aras yang berjaya dijalankan semua pemproses, inilah caranya. Malah satu EPYC 9554 muncul lebih awal daripada konfigurasi 2P EPYC 7773X secara keseluruhan… AMD 4th Gen EPYC hebat dengan pelaksanaan AVX-512, memori sistem DDR5, dua belas saluran memori dan penambahbaikan seni bina Zen 4 yang lain. EPYC 9554 2P 64-teras adalah 64% lebih pantas daripada keseluruhan konfigurasi EPYC 7763 2P 64-teras, atau 67% jika menjalankan EPYC 9554 2Ps dalam mod penentuan kuasa. Sementara itu, EPYC 9654 2P perdana adalah 74% lebih pantas daripada EPYC 7763 2P atau meningkat kepada 85% apabila CPU perdana Genoa berjalan dalam mod penentuan kuasa. AMD EPYC 9654 2P berjalan pada lebih 2x kelajuan perdana Intel semasa, pemproses Xeon Scalable 8380 2P”Ice Lake”.
Peningkatan generasi dari Milan ke Genoa ialah luar biasa merentasi rangkaian luas pelayan dan penanda aras HPC yang telah saya jalankan. Saya kini dibiarkan berkhayal tentang rupa Genoa-X tahun depan kerana mengetahui masih terdapat lebih banyak potensi untuk mengeluarkan Zen 4 pada bahagian pelayan serta CPU Bergamo tahun depan untuk sehingga 128 teras untuk tertumpu pada awan beban kerja pengkomputeran.
Seperti yang telah saya tunjukkan pada bahagian desktop siri Ryzen 7000, pelaksanaan AVX-512 AMD Zen 4 adalah sangat cekap dan ia lebih tepat pada bahagian pelayan. Dengan terdapatnya beban kerja yang lebih relevan di sini dapat menggunakan AVX-512 dan beberapa peningkatan yang menakjubkan seperti yang ditunjukkan di seluruh penanda aras ini.
Berdasarkan harga CPU, siri EPYC 9004 bersaing dengan EPYC 7003″yang sedia ada. Pemproses Milan(X)”dan pemproses Tasik Ais Boleh Skala Xeon. Walau bagaimanapun, peralihan kepada Genoa bermakna juga memerlukan memori sistem DDR5 ECC yang lebih mahal daripada DDR4. Saya belum menerima apa-apa maklumat harga lanjutan lagi pada mana-mana papan induk runcit EPYC Genoa jadi saya tidak pasti bagaimana ia akan berlaku tetapi mungkin dengan Socket SP5 yang lebih kompleks dan keperluan kuasa yang lebih tinggi ia akan menetapkan harga relatif yang lebih tinggi daripada apa yang kami telah dilihat dengan papan induk EPYC SP3. Pemproses EPYC Milan akan terus tersedia untuk mereka yang melihat pelayan berharga lebih rendah tetapi dengan prestasi yang masih sangat sihat.
Di bahagian sokongan Linux, kernel Linux hulu dan kunci lain komponen berada dalam keadaan yang baik untuk sokongan semasa pelancaran dengan siri EPYC 9004… Memang, itu agak diberikan dengan bahagian pasaran pelayan Linux hari ini. Tetapi masih ada ruang untuk AMD mengorak langkah dalam sokongan Linux/sumber terbuka mereka. Sebagai contoh, AMD lewat dengan patch IBRS Automatik mereka untuk kernel Linux dalam hanya menyiarkannya minggu lepas. Ia juga hanya dengan Linux 6.1 di mana AMD CPU cache-to-cache dan pelaporan memori dengan perf mendarat, bagi mereka yang berminat dengan keupayaan pemprofilan yang diperluaskan. Juga hanya ditayangkan dengan Linux 6.1 ialah fungsi LbrExtV2 Last Branch Record baharu kepada Zen 4. Sementara itu Linux 6.0 mengasingkan AMD X2AVIC untuk mesin maya KVM. Masih belum disalurkan dalam kernel Linux tetapi tersedia dalam bentuk tampalan ialah sokongan QoS di sekitar peruntukan lebar jalur memori yang perlahan dengan memori CXL dan Konfigurasi Acara Pemantauan Lebar Jalur (BMEC). Oleh itu, terdapat beberapa ciri tidak kritikal yang telah menyaksikan ketibaan lewat untuk kernel Linux talian utama, tetapi sekurang-kurangnya dari segi semua sokongan utama ia berada dalam keadaan yang baik untuk pelancaran. Sudah tentu sebaik sahaja ciri mencapai talian utama terdapat juga masa tambahan sebelum mencari kernel ini digunakan oleh pelbagai pengedaran Linux atau dialihkan kembali ke versi kernel perusahaan untuk seperti RHEL dan SLES. Secara positifnya, garis aliran huluan Linux AMD untuk masa prapelancaran telah bertambah baik untuk generasi pemproses EPYC/Zen (sebahagian besarnya kerana mereka telah mengambil lebih ramai jurutera Linux sejak dua tahun lalu).
Masih terdapat sudut malang sokongan penalaan pengkompil yang boleh dikatakan lewat untuk pemproses generasi baharu ini. Hanya pada pertengahan Oktober apabila AMD menghantar sokongan pengkompil Znver4 mereka untuk GCC yang menambah sasaran”-march=znver4″dan kemudian digabungkan ke dalam GCC 13 Git pada akhir Oktober. Tetapi dengan sokongan awal ini, ia membawa jadual kos/penalaan daripada Znver3–penalaan Znver4 dijangka”kemudian”. Mudah-mudahan sokongan yang ditala itu masih akan tiba pada masanya untuk GCC 13, yang seterusnya akan melihat keluaran stabilnya sebagai GCC 13.1 sekitar Mac~April tahun depan. Tetapi kemudian ia tidak akan sehingga kebanyakan pengedaran Linux H2’2023 dikeluarkan seperti Ubuntu 23.10 di mana GCC 13 digunakan sebagai pengkompil sistem lalai. Sekiranya AMD mendapat sokongan Znver4 mereka ke dalam GCC lebih awal daripada pelancaran (seperti Intel terkenal dan telah mengasingkan banyak kuasa Sapphire Rapids dan AMX mereka untuk GCC 12), ia mungkin sudah dihantar dalam Ubuntu 22.04 LTS dan pengedaran terbaharu yang lain. Terdapat juga tampung Znver4 untuk GNU Binutils yang terdapat dalam senarai mel dan sehingga artikel ini ditulis masih belum digabungkan.
Atau dengan cara lain, dalam keluaran pengkompil GCC 13 tahunan di mana AMD berada hanya memulakan sokongan Zen 4 mereka, Intel telah pun bekerja dan bergabung untuk sokongan GCC 13 untuk pelbagai pemproses 2023~2024. GCC 13 sudah pun beratur di Grand Ridge dan Granite Rapids, Meteor Lake, Sierra Forest, dan itu termasuk mendayakan pelbagai arahan baharu yang disertakan dengan pemproses tersebut. Ini jenis sokongan tepat pada masanya yang saya ingin lihat daripada AMD (dan bertahun-tahun yang lalu mereka menepati masa dengan sokongan GCC awal mereka) supaya pada masa pemproses ini dihantar, sokongan Znver4 sebaik-baiknya sudah berada dalam versi yang dikeluarkan/pengkompil stabil ditemui oleh pengedaran Linux terkini. Sehingga berita ini ditulis, belum ada sebarang tampalan Znver4 disiarkan untuk semakan huluan di bahagian LLVM/Clang sementara terdapat sekurang-kurangnya irama keluaran enam bulan. Intel terus mendahului dalam bahagian perisian apabila ia datang kepada pemasaan sumber terbuka/Linux yang cemerlang dalam kebanyakan kes sejak beberapa tahun yang lalu. Masa pembolehan huluan ialah kekesalan berulang yang saya alami dengan AMD setiap kitaran pelancaran; di pihak pengkompil, satu-satunya alasan logik yang saya ada ialah mereka mahu memainkan kad mereka dekat dengan vest dan tidak mendedahkan rancangan sambungan ISA baharu untuk generasi CPU akan datang terlalu awal.
Memang, melainkan anda menyusun dioptimumkan kod untuk sasaran CPU pelayan, sokongan pengkompil Znver4 ini tidak banyak (atau sebarang) isu kepada anda. Tetapi memandangkan daya tarikan AMD yang semakin meningkat dalam ruang pengkomputeran prestasi tinggi (HPC), agak mengejutkan mereka tidak menolak sokongan pengkompil ini lebih awal. Sekurang-kurangnya akan ada keluaran AMD Optimizing C/C++ Compiler (AOCC) baharu tidak lama lagi di mana Zen 4 berada dalam keadaan baik. Sebaik sahaja keluaran AOCC baharu itu dikeluarkan, saya pasti akan menjalankan beberapa penanda aras pengkompil di Genoa untuk melihat kesan sokongan pengkompil yang ditala pada pemproses pelayan Zen 4 ini.
Selain prestasi hebat dan sokongan Linux untuk pelancaran, satu lagi aspek menarik EPYC Generasi Ke-4 dari bahagian platform rujukan ialah Titanite berjalan dengan OpenBMC! Sangat mengujakan untuk melihat OpenBMC sumber terbuka berasaskan Linux digunakan sebagai timbunan perisian untuk rujukan BMC dan diharapkan ini akan diteruskan untuk melihat OpenBMC digunakan oleh lebih banyak pelayan siri EPYC 9004. Di samping itu, diharapkan minat industri/pelanggan terhadap perisian tegar sumber terbuka berterusan dan AMD membolehkan untuk melibatkan lebih banyak tentang Coreboot dan elemen perisian tegar sumber terbuka yang lain.
Sejauh mana Intel Sapphire Rapids menyusun berbanding EPYC Generasi Ke-4 akan menjadi pertempuran yang menarik. Sapphire Rapids hanya akan meningkat sehingga 60 teras berbanding 96 teras dengan Genoa, tetapi kelebihan Intel ialah Advanced Matrix Extensions (AMX), AVX-512 FP16 dan pelbagai blok pemecut baharu. Untuk perisian yang dapat memanfaatkan AMX dan IP pemecut Intel, ia akan menjadi persaingan yang sangat menarik sekurang-kurangnya untuk Genoa tetapi untuk beban kerja pelayan yang lebih tradisional akan memberikan cabaran yang agak ketara–perlu saya ingatkan anda maksud geo pada EPYC 9654 2P ialah 2x lebih daripada Xeon Platinum 8380 2P. Menarik juga untuk melihat bagaimana Intel bersaing dengan siri EPYC 9004 dalam penentuan harga terutamanya dengan Sapphire Rapids yang memperkenalkan Intel On Demand/Software Defined Silicon yang merumitkan lagi suasana penentuan harga terutamanya jika terikat dengan blok pemecut baharu yang menjadi keutamaan untuk menyampaikan prestasi kompetitif. Satu bidang yang akan menarik untuk Intel dengan Sapphire Rapids ialah SKU HBM2e mereka yang kini dikenali sebagai Xeon Max manakala pada tahun hadapan juga AMD akan mengumumkan Genoa-X. Antara faedah lain pemproses siri EPYC AMD Generasi Ke-4 termasuk sokongan CXL 1.1+ dan sokongan SEV-SNP yang diperluas dengan keupayaan penyulitan memori yang lebih tinggi dan lebih banyak VM.