Prestasi pemproses AMD EPYC Generasi Ke-4″Genoa”sememangnya luar biasa. Pemproses pelayan AMD baharu ini telah menunjukkan prestasi yang menakjubkan dengan sehingga 96 teras setiap soket dan melebihi jumlah teras yang meningkat kini sehingga 12 saluran memori DDR5-4800 dan paling ketara dalam ruang HPC ialah pengenalan sokongan AVX-512 dengan Zen 4. Malah prestasi Genoa frekuensi tinggi 32 teras telah mendominasi persaingan semasa Intel Xeon Scalable. Walaupun AMD EPYC Genoa membawa keuntungan yang sangat mengagumkan dari generasi ke generasi dan berbanding dengan CPU Xeon Ice Lake semasa, rasa ingin tahu mendapat yang terbaik daripada saya untuk melihat bagaimana CPU AMD EPYC baharu berbanding dengan perdana EPYC 1st Gen”Naples”AMD-EPYC 7601 2P. Berikut ialah penanda aras Genoa yang menunjukkan sejauh mana prestasi pelayan AMD/HPC telah berkembang sepanjang lima tahun yang lalu sejak Naples.
Untuk semakan hari pelancaran awal bulan ini disebabkan oleh masa kekangan ujian tertumpu pada perbezaan prestasi generasi dan terhadap persaingan Xeon Scalable semasa Intel. Tetapi dengan melihat keuntungan besar di sana terima kasih kepada sehingga 96 teras/AVX-512/dua belas saluran memori DDR5 dan penambahbaikan seni bina Zen 4 yang lain, rasa ingin tahu mendapat yang terbaik daripada saya untuk melihat sejauh mana prestasi pelayan AMD telah meningkat sejak pelancaran EPYC asal dengan pemproses”Naples”siri 7001.
AMD EPYC 7601 sebagai perdana Naples menggunakan 32 teras/64 utas menggunakan Zen 1, jam asas 2.2GHz, jam rangsangan maksimum 3.2GHz, cache L3 64MB dan TDP 180 Watt.
Kini dengan pemproses EPYC”Genoa”Generasi ke-4, model utama ialah EPYC 9654 dengan 96 teras/192 utas menggunakan Zen 4, jam asas 2.4GHz, jam rangsangan maksimum 3.7GHz, teras semua maksimum meningkatkan kelajuan 3.55GHz, 384MB cache L3 dan TDP 360 Watt. Atau jika turun ke bahagian 32 teras untuk memadankan kiraan teras/benang EPYC 7601, dengan EPYC 9374F ini bermakna jam asas 3.84GHz, rangsangan semua teras 4.1GHz dan jam rangsangan maksimum 4.3 GHz dan 256MB L3 cache tetapi dengan TDP 320 Watt. Jam asas EPYC 9374F melebihi jam rangsangan maksimum EPYC 7601 20% atau perbezaan 75% untuk jam asas sambil mempunyai 4x cache L3. Jam rangsangan maksimum EPYC 9374F adalah 34% lebih tinggi daripada jam rangsangan maksimum bagi perdana Naples itu.
Untuk penanda aras EPYC 7601 2P saya menggunakan Dell PowerEdge R7425 yang sebelum ini disediakan oleh AMD. Dell PowerEdge R7425 dengan EPYC 7601 2P dilengkapi dengan memori 16 x 32GB DDR4-2666 dan storan Intel Optane 280GB NVMe SSD. Semua ujian Genoa telah dilakukan dengan platform rujukan AMD Titanite yang disediakan oleh AMD bersama-sama dengan sampel semakan CPU. Itu berjalan dengan memori 24 x 64GB DDR5-4600, jadi kedua-dua pelayan berjalan untuk konfigurasi saluran/kelajuan memori dinilai optimum mereka.
Hasil penanda aras Genoa adalah sama seperti apa yang dipaparkan dalam ulasan EPYC 9374F/9554/9654 bulan ini sementara kini ujian EPYC 7601 2P telah selesai. Konfigurasinya ialah:
-AMD EPYC 7601 2P
-AMD EPYC 9374F
-AMD EPYC 9374F 2P [Kiraan teras/benang yang sama untuk perbandingan Naples]
-AMD EPYC 9554 [ Kiraan teras/benang yang sama seperti EPYC 7601 2P walaupun 1P]
-AMD EPYC 9554 2P
-AMD EPYC 9654 [SKU Genoa perdana semasa]
-AMD EPYC 9654 2P
Semua keputusan CPU berada dalam mod penentuan prestasi lalainya. Seperti yang ditunjukkan dalam artikel terdahulu, Genoa juga mendapat banyak manfaat daripada mod penentuan”kuasa”dan nombor tersebut boleh didapati dalam artikel terdahulu jika berminat.
Jelas sekali matlamatnya adalah untuk melihat juga EPYC 7601 Penggunaan kuasa/prestasi-per-Watt”Naples”juga, tetapi malangnya usaha itu digagalkan. Sekurang-kurangnya dengan platform Dell PowerEdge yang digunakan, antara muka pemantauan kuasa RAPL Linux sering melaporkan bacaan kuasa yang tidak tepat–melebihi penggunaan kuasa 1kW untuk CPU EPYC 7601 2P… Disebabkan oleh bacaan kuasa yang tidak boleh dipercayai untuk penggunaan kuasa CPU di Naples , malangnya tiada metrik kuasa dalam artikel hari ini.
Seperti biasa untuk fokus Linux kami, penanda aras telah dijalankan menggunakan Ubuntu 22.10 dengan menaik taraf kepada kernel Linux 6.0 untuk kedua-dua platform Genoa dan Naples. Oleh itu, lihat semula bagaimana perkakasan berusia lima tahun itu lakukan dengan perisian sumber terbuka/Linux yang terkini.
Apa yang sepatutnya tidak mengejutkan sesiapa sahaja yang mengikuti langkah epik AMD selama lima tahun yang lalu dengan setiap kejayaan. Penjanaan Zen, ia merupakan perbezaan dramatik daripada pemproses EPYC 7601 2P”Naples”kepada pemproses Genoa baharu… Dengan EPYC 7601 2P menyediakan gabungan 64 teras/128 utas, ia sedang disembelih dalam beban kerja HPC yang berat oleh satu EPYC CPU 32-teras/64-benang 9374F/
Atau dalam kes perisian dinamik molekul NAMD, EPYC 7601 2P hanya berjaya memadankan CPU EPYC 9374F itu pada separuh kiraan teras/benang. Jika membandingkan SKU perdana dari Naples ke Genoa, ia berkali ganda lebih pantas.
Bagi mereka yang menggunakan pemproses EPYC Naples yang masih mencapai tahap lima tahun, menaik taraf kepada Genoa boleh bermakna sama ada menggunakan sistem 2P dan melihat secara dramatik lebih baik prestasi atau jika prestasi yang mengagumkan tidak diperlukan sebaliknya boleh bermakna memekatkan pelayan anda kepada platform 1P untuk mendapatkan kuasa/ruang dan menikmati TCO yang lebih rendah.
Dengan penanda aras ramalan cuaca WRF yang menuntut, EPYC 9374F tunggal adalah dua kali lebih pantas berbanding dua soket EPYC 7601… Dengan Genoa EPYC 9654 2P perdana baharu, ia menjalankan model konus 2.5km dalam hanya 19% masa yang diambil oleh perkakasan perdana EPYC Naples yang asal. Sudah tentu, jika menggunakan mod penentuan kuasa dengan Genoa, ia boleh menjadi lebih pantas.
Sangat menghiburkan untuk melihat sejauh mana prestasi EPYC telah berkembang sepanjang lima tahun yang lalu sejak pelancaran. Amat buruk walaupun pemacu Linux pemantauan kuasa RAPL tidak berfungsi dengan betul untuk Zen 1 kerana menunjukkan peningkatan prestasi setiap Watt juga.
Satu EPYC 9374F dengan mudah mengatasi konfigurasi EPYC 7601 2P untuk mereka yang ingin menaik taraf pelayan lama mereka dan ingin menjimatkan ruang rak, kuasa, dll. Atau menggunakan EPYC 9554 1P untuk memadankan kiraan benang/teras yang sama seperti 2P EPYC 7601 juga akan menjadi peningkatan yang bagus dalam konfigurasi 1P sementara menikmati peningkatan besar-besaran.
Melalui perkara ini, sudah pasti Genoa akan menyembelih Naples manakala margin untuk beberapa ujian ini lebih besar daripada yang saya jangkakan.
Untuk AI/beban kerja pembelajaran mesin dan perisian lain yang banyak menggunakan AVX-512, perbezaan prestasi dari Naples ke Genoa adalah gila. Siri AMD EPYC 9004 yang memperkenalkan sokongan AVX-512 dengan pendekatan”pengepam berganda”yang cekap telah berjaya dengan sangat baik untuk benar-benar meningkatkan prestasi AI/ML untuk CPU EPYC sambil tidak terganggu oleh ketidakcekapan kuasa yang mencabar pemproses Xeon AVX-512 terdahulu.
Ya, penanda aras ini betul… Itulah perbezaan lima tahun AMD EPYC. Pustaka rangkaian neural oneDNN Intel ialah satu lagi pengguna berat AVX-512.
Walaupun menggunakan pelayan AMD EPYC generasi terdahulu hanya sebagai pelayan CI/build, peningkatan kepada Genoa boleh menjadi sangat berbaloi dari Naples. Malah satu EPYC 9374F telah memberikan kelajuan binaan yang lebih pantas secara dramatik berbanding pelayan 2P EPYC 7601 Naples.
Apa sahaja yang anda mahu berikan kepada Naples dan Genoa, ia adalah perbezaan lima tahun yang menakjubkan untuk AMD pada HPC/hadapan pelayan. Sekali lagi, agak menyedihkan tentang kekurangan laporan RAPL yang berfungsi pada Zen 1 kerana dapat memberikan angka prestasi setiap Watt yang tepat.
Untuk beban kerja berat AVX-512, walaupun pergi dari Rom atau Milan ke Genoa boleh masuk akal dan berfungsi sebagai peningkatan yang berbaloi untuk prestasi yang lebih baik atau ingin mengurangkan rackspace/jejak kuasa anda.
Ini merupakan satu perjalanan yang agak sukar untuk AMD dengan kemajuan yang dicapai dalam tempoh lima tahun yang lalu.
Malah melancarkan beberapa penanda aras Python dan PHP benang tunggal menunjukkan kemajuan hebat yang telah dicapai oleh AMD daripada Zen 1 kepada Zen 4.
Pencapaian prestasi AMD yang diperoleh daripada EPYC”Naples”Gen 1 kepada EPYC”Genoa”Gen Ke-4 sepanjang lima tahun yang lalu adalah sesuatu yang luar biasa. Sepanjang semua beban kerja terdapat peningkatan besar-besaran dan EPYC 9374F pada separuh kiraan teras/benang konfigurasi EPYC 7601 2P biasanya mengatasi konfigurasi Naples perdana. Apabila mencapai beban kerja AVX-512, Genoa menjadi bosan dengan prestasi dalam menyampaikan peningkatan prestasi yang besar–malah secara generasi ke atas Milan seperti yang ditunjukkan dalam artikel penanda aras saya sebelum ini. Lihat lebih banyak tanda aras daripada perbandingan Naples vs. Genoa ini melalui halaman hasil Penandaarasan Terbuka ini .
Jika mengambil min geometri bagi hampir 200 penanda aras yang dijalankan, beginilah prestasinya berada pada tahap tinggi… EPYC 7601 2P berjalan pada separuh kelajuan a EPYC 9374F tunggal iaitu hanya 32 teras/64 utas. Jika menjalankan pelayan berusia 3~5 tahun, peningkatan kepada Genoa boleh memberikan jawapan yang menarik dengan mudah jika ingin menyatukan jejak fizikal dan kuasa anda. Sungguh menyedihkan pelaporan kuasa tidak berfungsi untuk CPU Zen 1 di Linux, tetapi perlu diingat bahawa EPYC 7601 ialah TDP 180 Watt atau jelas 360 Watt untuk 2P. EPYC 9374F dalam konfigurasi 1P mempunyai TDP 320 Watt, atau sekitar 15% kurang daripada perdana 2P Naples sambil menyampaikan prestasi dua kali ganda keseluruhannya.
Jika beralih daripada EPYC 7601 2P perdana kepada EPYC 9654 2P untuk teratas, itu merupakan peningkatan 4.26x dalam tempoh lima tahun yang lalu sejak AMD memperkenalkan pemproses EPYC mereka.
Jika mengehadkan min geometri hanya kepada penanda aras kompilasi kod, seperti jika menjalankan pelayan CI/bina yang semakin tua, berpindah ke Genoa boleh bermakna masa binaan yang lebih pantas sementara juga kemungkinan untuk menyatukan pelayan anda dan mengurangkan penggunaan kuasa.
Apabila melihat hanya penanda aras pengkomputeran prestasi tinggi (HPC) adalah tempat keputusan mula benar-benar menunjukkan sejauh mana AMD telah datang dalam tempoh lima tahun dengan EPYC…
Atau jika melihat pembelajaran mesin/penanda aras AI adalah di mana ia mencapai tahap kegilaan. Lebih 13x penambahbaikan daripada perdana EPYC Naples 2P yang asal kepada perdana EPYC Genoa 2P… Disebabkan penggunaan AVX-512 yang banyak dalam penanda aras inilah yang membawa kepada perbezaan yang luar biasa selama lima tahun prestasi AMD EPYC.
Atau sebagai satu lagi metrik yang menyeronokkan, langkah yang dibuat apabila melihat semua beban kerja Intel oneAPI diuji… Embree, oneDNN. Open Image Denoise, OSPRay/OSPRay Studio dan OpenVINO. Intel telah mengeluarkan perisian sumber terbuka yang hebat selama bertahun-tahun. Dengan perisian sumber terbuka Intel, mereka telah melabur banyak dalam penggunaan AVX-512 untuk memanfaatkan pemproses Xeon mereka manakala kini Zen 4 dengan pelaksanaan AVX-512 yang cekap menunjukkan peningkatan yang besar.
Di luar AVX-512, beralih ke dua belas saluran memori sistem DDR5 membantu dalam banyak beban kerja, CPU TDP yang lebih tinggi dan banyak peningkatan seni bina lain daripada Zen 1 kepada Zen 4.
Berdasarkan nilai, pemproses EPYC terus menjadi harga kompetitif. Keutamaan EPYC 7601 dilancarkan pada kira-kira $4200 USD pada 2017 (atau jelas sekali, ~$8400 untuk 2P) manakala sekarang pada 2022 dengan EPYC 9374F yang dalam bentuk 1P memberikan prestasi yang jauh lebih baik daripada dua Naples berharga ~$4598. Di bahagian atas, pemproses 96-teras EPYC 9654 menetapkan harga senarai sekitar $11,805.
Adalah menarik untuk memikirkan bahawa prestasi ini hanyalah siri AMD EPYC 9004 pada pelancaran pada Linux… Pengkompil stabil GCC 12 yang digunakan dengan Ubuntu 22.10 untuk membina penanda aras sumber terbuka bahkan tidak mempunyai penalaan Zen 4 (znver4) dan dalam GCC huluan yang masih menunggu kerja untuk menyampaikan lebih banyak penalaan pengkompil. Seperti yang ditunjukkan secara berasingan dalam penanda aras pengkompil AMD AOCC 4.0 saya, terdapat peningkatan prestasi yang boleh diukur daripada pengkompil yang ditala AMD atau apa yang diharapkan akan melihat tahap prestasi yang serupa dalam versi Clang dan GCC akan datang. Ia juga akan menjadi menarik untuk melihat pengoptimuman perisian lain yang mungkin datang ke kernel Linux dan di tempat lain dengan pembangun kini dapat memanfaatkan pelayan 2P 192 teras/384 utas, kemungkinan berterusan di sekitar AVX-512 dalam lebih banyak perisian sekarang kerana Zen 4 menyokongnya merentas papan ke CPU desktop, dsb.
Lihat hari pelancaran saya ulasan AMD EPYC Genoa untuk titik perbandingan Milan, cara CPU ini disusun berbanding pemproses Intel Xeon Scalable semasa, dan juga faedah prestasi menjalankan CPU dalam mod penentuan kuasa. Ia akan menjadi sangat menarik pada tahun baharu untuk melihat sejauh mana AMD EPYC Genoa seterusnya bersaing dengan pemproses Sapphire Rapids yang telah lama ditunggu-tunggu oleh Intel.