Pengembang emulator’PlayStation 3’RPCS3 telah memposting blog mendetail yang menyoroti keunggulan AVX-512 pada CPU modern. Entri blog membantu kami memahami cara kerja AVX-512 dan manfaatnya bagi emulator bagi mereka yang ingin mendapatkan kinerja ekstra.
RPCS3’PlayStation 3 Emulator’Dev Sorotan Keunggulan Kinerja AVX-512 CPU yang Diaktifkan
Blog ini diterbitkan oleh Whatcookie, salah satu dari banyak pengembang di Emulator RPCS3 memproyeksikan dan membandingkan bagaimana AVX-512 membantu atas instruksi AVX2 standar. Anda dapat membaca blog selengkapnya di sini atau untuk membuatnya tetap sederhana, keunggulan utama AVX-512 datang dalam bentuk:
GPU AMD Radeon Dapatkan Peningkatan Besar, Hingga 55%, Dalam Kinerja Grafis OpenGL Dengan Segera Meluncurkan Driver Windows 11 22H2
File register yang lebih besar Bentuk baru dari instruksi lama Mask register
Pengembang menunjukkan bagaimana semua ini membantu dalam meningkatkan kinerja dalam RPCS3, pilihan utama untuk Emulator PS3. CPU Intel Core i9-12900K digunakan untuk pengujian pada 5,2 GHz dengan AVX-512 diaktifkan. Menggunakan instruksi SSE2 standar, game ini hanya menghasilkan 5 FPS sementara pindah ke SSE 4.1 menghasilkan keuntungan 160 FPS yang sangat besar. Disebutkan bahwa alasannya adalah karena kurangnya instruksi SSSE3 yang penting untuk Emulator PlayStation 3.
Pindah ke AVX2/FMA, Anda mendapatkan tambahan 13 % peningkatan kinerja, dan beralih dari AVX2 ke AVX-512, Anda mendapatkan peningkatan kinerja 30% menjadi 242 FPS.
Target SSE4.1 mencapai rata-rata 160 FPS, sedangkan AVX2/Target FMA mencapai rata-rata 190 FPS. Ini adalah peningkatan 18% dari target SSE4.1. AVX2 tidak menyertakan banyak instruksi baru di atas SSE4.1, tetapi menyertakan 3 formulir operan baru untuk instruksi, yang menghilangkan banyak instruksi pindah ke register. Yang terpenting, semua CPU yang mendukung AVX2 juga mendukung petunjuk FMA. Instruksi FMA tidak hanya lebih cepat dari rangkaian instruksi perkalian + penambahan, tetapi juga dapat menghasilkan hasil yang berbeda karena tidak membulatkan ke presisi tunggal antara perkalian dan penambahan. Meniru ini secara akurat tanpa instruksi FMA menambahkan beberapa overhead, sehingga operasi FMA asli sedikit membantu.
Target AVX-512 tingkat Icelake mencapai rata-rata 235 FPS yang menggelikan, 23% lebih cepat daripada AVX2/FMA target. Jumlah instruksi baru yang ditambahkan dalam AVX-512 sangat banyak sehingga cukup banyak yang akhirnya berguna untuk RPCS3. Tidak seperti AVX2 yang sebagian besar merupakan perpanjangan langsung dari instruksi SSE yang ada menjadi 256 bit, AVX-512 menyertakan sejumlah besar fitur baru yang sangat berguna untuk pemrograman SIMD, bahkan pada lebar bit yang lebih rendah. Namun, karena intel memilih untuk memasarkan AVX-512 dengan moniker-512, orang yang tidak familiar dengan set instruksi biasanya terpaku pada aspek vektor 512 bit dari set instruksi.
melalui Whatcookie Github Blog
Sementara Intel telah menghapus dukungan AVX-512 dari CPU Alder Lake Generasi ke-12, kami telah melihat potensi kinerja dan sepertinya jajaran CPU Zen 4’Ryzen 7000’AMD yang baru-baru ini diumumkan dapat mengambil keuntungan besar dari itu. Arsitektur inti Zen 4 akan mendukung AVX-512 dan jika ada penerus Steam Deck atau berbagai konsol genggam lainnya yang memanfaatkan CPU generasi berikutnya, kita dapat melihat beberapa pengguna memanfaatkan set instruksi untuk meniru game lama dengan sangat baik. kinerja.
Ini akan terbukti sangat bermanfaat bagi Emulator’PlayStation 3’RPCS3 & dapat memaksa tim biru untuk mempertimbangkan kembali menghapus AVX-512 dari chip konsumennya.
Sumber Berita: RPCS3