AMD Instinct MI200 พร้อม 110 Compute Units?

การอัปเดต ROCm อาจเปิดเผยการกำหนดค่าของตัวเร่ง MI200

ความฝันของซีลาแคนท์ พบการกระทำของ Github ระบุการกำหนดค่าที่เป็นไปได้ของตัวเร่งความเร็ว AMD ที่จะเกิดขึ้นตามโปรเซสเซอร์ Aldebaran GPU นี้ใช้สถาปัตยกรรม CDNA2 และเชื่อว่ามีชื่อรหัสภายในของ GFX90A ซึ่งบ่งชี้ว่าเป็นอนุพันธ์ของสถาปัตยกรรม GFX 9th Family (Vega)

รหัสแสดงรายการ GFX906_60 ซึ่งสันนิษฐานว่าเป็น Instinct MI60, GFX908_120 ซึ่งเป็น Instinct MI100 และ GFX90A_110 น่าจะเป็นตัวเร่งความเร็วรุ่นต่อไปจาก AMD หมายเลข GFX ไม่สำคัญที่นี่ แต่ตัวเลขที่แนบมากับ ID สถาปัตยกรรม GPU เหล่านั้นคือ 60 ย่อมาจาก 60 Compute Units ซึ่งเป็นการกำหนดค่าของ MI60 ในขณะที่ 120 หมายถึง 120 Compute Units สำหรับ Instinct MI100 ดังนั้น 110 จึงจะเป็นการกำหนดค่าของ MI200 ดังนั้น ตัวเร่งกราฟิกจะมีหน่วยประมวลผล 110 หน่วย ซึ่งน้อยกว่า Arcturus 10 หน่วย

ROCm commit with GFX90A_110, Source: Github

เห็นได้ชัดว่านี่ไม่ใช่การกำหนดค่า GPU ทั้งหมด แต่เป็น จำนวนคลัสเตอร์คอร์ GPU ที่ใช้งานอยู่ (หน่วยคำนวณ) ใน SKU เฉพาะนี้ เพื่อรักษาผลตอบแทนที่ดี AMD จำเป็นต้องปิดการใช้งาน GPU บางส่วนเพื่อพิจารณาข้อบกพร่องที่อาจเกิดขึ้นในการผลิต มีข่าวลือว่า GPU Aldebaran เต็มรูปแบบจะมีหน่วยประมวลผล 128 ตัว

เมื่อพิจารณาจากการตั้งค่าของ Shader Engine และ CU ที่แตกต่างกัน Aldebaran/MI200 เป็นการกำหนดค่า MCM ที่มี 2 GPU dies ดังนั้นหากการตั้งค่านั้นสมมาตร สำหรับแต่ละไดท์แทนที่จะเป็น Shader Engine แต่ละไดมอนด์จะมี 4 SEs เป็นไปได้ที่จะมี (56 CU) และปิดการใช้งานแต่ละอันเพื่อให้มีทั้งหมด 110 CU

— ความฝันของ Coelacanth

ไม่ชัดเจนว่า AMD กำลังวางแผนที่จะเพิ่มจำนวนคอร์ FP32 เป็นสองเท่าบนสถาปัตยกรรม CDNA2 แต่สมมติว่าเป็นเช่นนั้นด้วยนาฬิกา GPU 1500 MHz ตามทฤษฎีที่ตัวเร่งความเร็วจะนำเสนอประสิทธิภาพการประมวลผลแบบแม่นยำเดียวที่ 42.2 TFLOPS มากกว่า MI100 1.82 เท่า หากไม่เป็นเช่นนั้น MI200 จะต้องมีนาฬิกาอย่างน้อย 1650 MHz เพื่อเข้าถึงปริมาณงาน FP32 เดียวกันกับ 23 TFLOP

ในกรณีของตัวเร่ง HPC เช่น MI200 ประสิทธิภาพของ FP64 มีความสำคัญมากกว่ามาก ตามการรั่วไหลก่อนหน้านี้ MI200 จะนำเสนอประสิทธิภาพ FP64 อัตราเต็ม ซึ่งหมายความว่าอาจเพิ่มเป็นสองเท่าหรือสี่เท่าของประสิทธิภาพเหนือ MI100 ขึ้นอยู่กับสถาปัตยกรรม

MI200 ได้รับการยืนยันที่จะเปิดตัวในปีนี้ นี่เป็นโปรเซสเซอร์กราฟิกแบบมัลติชิปตัวแรกของ AMD ที่มีแอคทีฟไดย์สองตัว คาดว่าจะมาพร้อมหน่วยความจำ HBM2e 128GB (4 เท่าของ MI100) ที่เร็วขึ้น

ชื่อตัวเร่ง AMD Instinct AcceleratorAMD Radeon Instinct MI60AMD Instinct MI100AMD Instinct MI200Architecture7nm GCN5 (GFX906)7nm CDNA1 (GFX908)CDNA2 (GFX90A)GPUVega 20ArcturusAldebaran (MCM)หน่วยคำนวณ60 (60)120 (128)110 (128)FP32 Cores (Full GPU)3840 (3840) 7680 (8192)7040 (8192) (?)ความเร็วสัญญาณนาฬิกา GPU1800 MHz~1500 MHzTBCFP16 Compute29.5 TFLOPs185 TFLOPsTBCFP32 Compute14.7 TFLOPs23.1 TFLOPsTBCFP64 Compute7.4 TFLOPs11.5 TFLOPsTBCVRAM32 GB HBM232 GB HBM2>128 GB HBM2Eนาฬิกาหน่วยความจำ1000 MHz1200 MHzTBCMemory Bus4096-bit bus4096-bit busTBCMemory แบนด์วิดท์1 TB/s1.23 TB/sTBCForm FactorDual Slot, Full LengthDual Slot, Full LengthOAMCoolingPassive CoolingPassive CoolingTBCTDP300W300WTBC table>

ที่มา: ROCm Github ผ่าน ความฝันของซีลาแคนท์

Categories: IT Info