AMD telah mengeluarkan AOMP 17.0-1 sebagai versi terbaru pengkompil sumber terbuka ini memfokuskan pada penyediaan sokongan pemunggahan OpenMP terkini untuk produk pemecut Radeon dan Instinct.

AOMP ialah satu set tampalan yang dibawa di atas keadaan LLVM/Clang huluan terkini. Jurutera AMD terus berusaha untuk memajukan pelbagai penambahbaikan mereka kepada LLVM manakala bagi mereka yang mahukan teknologi canggih, sokongan terbaik mempunyai AOMP untuk memanfaatkan keupayaan peranti OpenMP terbaik sekarang.

AOMP 17.0-1 adalah berdasarkan keadaan huluan LLVM/Clang dari awal bulan ini dan dibina dengan sumber ROCm 5.4.4 AMD. Terkenal dengan kemas kini ini ialah beralih kepada pemalam generasi seterusnya secara lalai yang seterusnya akan menghasilkan peningkatan prestasi OpenMP yang ketara.


Pengumuman keluaran menyebut perkara berikut perubahan untuk AOMP 17.0-1:

-Tukar kepada pemalam nextgen sebagai lalai. Ini telah menunjukkan peningkatan prestasi yang ketara. Untuk kembali kepada pemalam lama tetapkan LIBOMPTARGET_NEXTGEN_PLUGINS=OFF.

-Tukar daripada hostrpc kepada hostexec. hostexec ialah penulisan semula yang penting bagi hostrpc. Peranti hostexec_invoke kini ditulis dalam OpenMP untuk mudah alih ke platform lain. Nama pembungkus (stub) untuk menjalankan fungsi hos telah bertukar kepada hostexec() dan hostexec_(). hostexec juga menggunakan pembolehubah global untuk mencari penimbal muatan pemindahan dan bukannya args kernel tersirat AMD. Ini akan menyokong kemudahalihan hosexec, printf, dan fprintf ke platform lain. Kemas kini kepada peranti global ini dibuat dengan perkhidmatan pembolehubah global dalam pemalam nextgen.

-Contoh penggunaan hosexec untuk menjalankan MPI_Send dan MPI_Recv dalam kawasan sasaran diberikan. Contoh ini menunjukkan cara pemilik perpustakaan boleh membina fail pengepala tambahan untuk membolehkan pelaksanaan hos telus bagi fungsi perpustakaan terpilih dalam kawasan sasaran OpenMP dengan antara muka hos yang sama. Ini menghapuskan keperluan untuk sebarang perubahan sumber dalam kod pengguna apabila pelaksanaan hos dari kawasan sasaran dikehendaki. Sebelum hostexec, pengguna biasanya perlu menamatkan wilayah sasaran mereka, melaksanakan fungsi hos sahaja, kemudian memulakan kawasan sasaran yang lain. Ciri ini meningkatkan dengan ketara keupayaan pengkomputeran tujuan umum OpenMP pada platform GPGPU.

-Sokongan sasaran OMPT tidak lengkap dengan pemalam nextgen. Untuk menggunakan OMPT, tetapkan pembolehubah persekitaran LIBOMPTARGET_NEXTGEN_PLUGINS=OFF.

-Tetapkan GPU_MAX_HW_QUEUES dalam gpurun

-Kawasan kritikal yang dicipta melalui arahan kritikal kini lebih cekap: dengan melonggarkan semantik kunci dan menggabungkannya dengan penggunaan pagar peroleh dan lepaskan kami boleh mengehadkan pembilasan cache GPU kepada setiap kali kunci diperoleh dan bukannya pada setiap pemeriksaan kunci.

-Apabila menyelaraskan fungsi dipanggil daripada kernel, alihkan peruntukan untuk argumen mereka dalam blok kemasukan kernel dan bukannya meninggalkannya pada titik pelancaran.

-Hormati pembolehubah persekitaran untuk memaksa pelaksanaan kawasan sasaran segerak. Tersedia melalui OMPX_FORCE_SYNC_REGIONS=1.

Muat turun AOMP 17.0-1 dan butiran lanjut di GitHub termasuk binari RHEL/Debian untuk melengkapkan sumber.

Categories: IT Info