Situs web Mimpi Coelacanth menemukan komit Github yang mungkin menandakan konfigurasi di masa mendatang ke akselerator Instinct berbasis GPU AMD Aldebaran yang mendekat. GPU baru, dengan nama kode’GFX90A,”akan memanfaatkan arsitektur CDNA2, turunan dari struktur Keluarga ke-9 GFX (struktur Vega).

AMD Instinct MI200 Dapat Menampilkan Dua 110 Unit Komputasi CDNA 2 GPU Dies

Ada tiga kode, GFX906_60, GFX908_120, dan GFX90A_110, masing-masing spesifik untuk sumber yang berbeda. GFX906_60 diduga merujuk pada Instinct MI60, GFX908_120 adalah Instinct MI100, dan GFX90A_110 dapat digunakan untuk akselerator AMD generasi baru. Dengan setiap kode, bagian ketiga mengacu pada unit komputasi.

CPU AMD Zen+ & Zen 2 Rentan Terhadap Serangan Cyber ​​Seperti Meltdown

Misalnya, MI60 akan menggunakan 60 unit komputasi, MI100 akan menggunakan 120 unit, dan yang terakhir akan menggunakan 110 unit komputasi. Yang menarik, akselerator generasi berikutnya dari AMD menggunakan unit komputasi yang lebih sedikit daripada MI100.

Sumber: VideoC ardz

Dinyatakan bahwa GPU Aldebaran akan menampilkan 128 unit komputasi, yang tidak sesuai dengan informasi yang diterima tentang kode generasi berikutnya untuk akselerator AMD yang baru. Namun, GPU apa pun biasanya akan menonaktifkan beberapa cluster, yang jika ini benar, akan menurunkannya menjadi 110 unit komputasi aktif.

Mengingat pengaturan Shader Engine dan CU yang berbeda, Aldebaran/MI200 adalah konfigurasi MCM dengan 2 GPU dies, jadi jika pengaturan simetris untuk setiap die, bukan Shader Engine, setiap die akan memiliki 4 SE. Dimungkinkan untuk memiliki (56 CU), dan menonaktifkan masing-masing untuk membuat total 110 CU.

— Impian Coelacanth

Situs VideoCardz menyatakan,

Tidak jelas apakah AMD berencana untuk menggandakan jumlah inti FP32 pada arsitektur CDNA2, tetapi dengan asumsi bahwa mereka melakukannya, dengan jam GPU 1500 MHz teoritis, akselerator akan menawarkan kinerja komputasi presisi tunggal 42,2 TFLOPS, 1,82x lebih banyak dari MI100. Jika bukan itu masalahnya, maka MI200 harus memiliki setidaknya clock 1650 MHz untuk mencapai throughput FP32 yang sama yaitu 23 TFLOP.

Dalam kasus akselerator HPC seperti MI200, kinerja FP64 jauh lebih penting. Menurut kebocoran sebelumnya, MI200 akan menampilkan kinerja FP64 tingkat penuh, yang berarti menggandakan atau melipatgandakan kinerja di atas MI100, tergantung pada arsitekturnya.

MI200 AMD diatur untuk dirilis sebelum akhir 2021. Ini adalah prosesor grafis multi-chip revolusioner mereka yang dibangun dengan dua die aktif dan memori HBM2e 128 gigabyte.

Kartu Grafis AMD Radeon RX 6900 XTX Dikabarkan Akan Menampilkan Memori GDDR6 18 Gbps, Meningkat Kecepatan Jam Dengan GPU Navi 21 XTXH, Lebih Cepat Dari RTX 3090

Inilah Yang Diharapkan Dari Akselerator GPU AMD Instinct MI200’CDNA 2′

Di dalam AMD Instinct MI200 terdapat GPU Aldebaran yang menampilkan dua mati, sekunder dan primer. Ini memiliki dua mati dengan masing-masing terdiri dari 8 mesin shader untuk total 16 SE. Setiap Mesin Shader mengemas 16 CU dengan FP64 tingkat penuh, FP32 yang dikemas & Mesin Matriks Generasi ke-2 untuk operasi FP16 & BF16. Setiap die, dengan demikian, terdiri dari 128 unit komputasi atau 8192 prosesor aliran. Ini membulatkan hingga total 220 unit komputasi atau 14.080 prosesor aliran untuk seluruh chip. GPU Aldebaran juga didukung oleh interkoneksi XGMI baru. Setiap chiplet dilengkapi mesin VCN 2.6 dan pengontrol IO utama.

Diagram blok GPU Aldebaran bertenaga CDNA 2 AMD yang akan menggerakkan akselerator HPC Instinct MI200 telah divisualisasikan. (Kredit Gambar: Locuza)

Untuk DRAM, AMD telah menggunakan antarmuka 8 saluran yang terdiri dari antarmuka 1024-bit untuk antarmuka bus lebar 8192-bit. Setiap antarmuka dapat mendukung modul DRAM HBM2e 2GB. Ini akan memberi kami kapasitas memori HBM2e hingga 16 GB per tumpukan dan karena total ada delapan tumpukan, jumlah total kapasitas akan menjadi 128 GB. Itu 48 GB lebih banyak dari A100 yang menampung 80 GB memori HBM2e. Visualisasi penuh dari GPU Aldebaran pada Instinct MI200 tersedia di sini.

AMD Radeon Instinct Accelerators 2020

Accelerator NameAMD Radeon Instinct MI6AMD Radeon Instinct MI8AMD Radeon Instinct MI25AMD Radeon Instinct MI50AMD Radeon Instinct MI60AMD Instinct MI100AMD Instinct Arsitektur GPU MI200Polaris 10Fiji XTVega 10Vega 20Vega 20Arcturus (CDNA 1)Aldebaran (CDNA 2) Proses GPU Node14nm FinFET28nm14nm FinFET7nm FinFET7nm FinFET7nm FinFETNode Proses Lanjutan GPU Cores23040967680963840409676 GPU Kecepatan Jam1237 MHz1000 MHz1500 MHz1725 MHz1800 MHz~1500 MHzTBA FP16 Hitung5.7 TFLOPs8.2 TFLOPs24.6 TFLOPs26.5 TFLOPs29.5 TFLOPs185 TFLOPsTBA FP32 Hitung5.7 TFLOPs8.2 TFLOPs12.3 TFLOPs14.7 TFLOPsTBA13.3 TFLOPsTBA13.3 TFLOPsTBA13.3 TFLOPs Hitung384 GFLOPs512 GFLOPs768 GFLOPs6.6 TFLOPs7.4 TFLOPs11.5 TFLOPsTBA VRAM16 GB GDDR54 GB HBM116 GB HBM216 GB HBM232 GB HBM232 GB HBM264/128 GB HBM2e? Memory Clock1750 MHz500 MHz945 MHz1000 MHz1000 MHz1200 MHzTBA Memory Bus256-bit bus4096-bit bus2048-bit bus4096-bit bus4096-bit bus4096-bit bus8192-bit Memory Bandwidth224 GB/s512 GB/s484 GB/s1 TB/s1 TB/s1,23 TB/s~2 TB/dtk? Faktor BentukSlot Tunggal, Panjang PenuhDual Slot, Setengah PanjangDual Slot, Panjang PenuhDual Slot, Panjang PenuhDual Slot, Panjang PenuhDual Slot, Panjang PenuhDual Slot, Panjang Penuh/OAM CoolingPendingin PasifPendingin PasifPendingin PasifPendingin PasifPendingin PasifPendingin Pasif TDP150W175W300W300W300W300>

ROCm Github, Coelacanth’s Dream

Categories: IT Info