Instinct MI200 เรือธงของ AMD ใกล้จะถึงแล้ว เปิดตัวและจะเป็น GPU ตัวแรกสำหรับกลุ่ม HPC ที่มีการออกแบบ MCM ตามสถาปัตยกรรม CDNA 2 ดูเหมือนว่า GPU จะเสนอตัวเลขประสิทธิภาพที่บ้าบอเมื่อเทียบกับ Instinct MI100 GPU ที่มีอยู่ด้วยการประมวลผล FP16 ที่เพิ่มขึ้น 4 เท่า

AMD Instinct MI200 พร้อมการออกแบบ GPU CDNA 2 MCM มุ่งสู่ HPC เร็วๆ นี้ มาพร้อมประสิทธิภาพที่มหึมา ตัวเลขและการคำนวณเพิ่มขึ้น 4 เท่าเมื่อเทียบกับ Instinct MI100

เราต้องเรียนรู้ข้อกำหนดของ Instinct MI200 accelerator เมื่อเวลาผ่านไป แต่ตัวเลขประสิทธิภาพโดยรวมยังคงเป็นปริศนามาจนถึงตอนนี้ ExecutableFix วงในของ Twitter ได้แชร์เมตริกประสิทธิภาพแรกสำหรับตัวเร่ง MCM GPU ที่ใช้ CDNA 2 ของ AMD และเป็นสัตว์เดรัจฉาน.

AMD และ Microsoft ปล่อยแพตช์อย่างเป็นทางการสำหรับ Windows 11 ข้อผิดพลาดในการแก้ไขปัญหา Ryzen CPU L3 และ CCPC2

นาฬิกาเร่งความเร็ว 1.7GHz อย่างที่คุณพูด: สูงมาก 😜

— ExecutableFix (@ExecuFix) 23 ตุลาคม 2564

จากทวีตของ ExecutableFix นั้น AMD Instinct MI200 จะเพิ่มความเร็วสัญญาณนาฬิกาที่ 1.7 GHz ซึ่งเพิ่มขึ้น 13% จาก Instinct MI100 MCM GPU ที่ขับเคลื่อนด้วย CDNA 2 ยังเพิ่มจำนวนสตรีมโปรเซสเซอร์เกือบสองเท่าที่ 14,080 คอร์ ซึ่งบรรจุอยู่ใน 220 Compute Units ในขณะที่คาดว่า GPU จะเขย่า 240 หน่วยประมวลผลด้วย 15,360 คอร์ การกำหนดค่าถูกแทนที่ด้วยตัวแปรที่ลดลงเนื่องจากผลตอบแทน จากที่กล่าวมา มีความเป็นไปได้ที่เราอาจเห็นการเปิดตัว SKU เต็มรูปแบบในอนาคต โดยให้ประสิทธิภาพที่สูงขึ้น

383 FP16/BF16

— ExecutableFix (@ExecuFix ) 23 ตุลาคม 2564

ในแง่ของประสิทธิภาพ AMD Instinct MI200 HPC Accelerator จะนำเสนอ TFLOPs เกือบ 50 TFLOPs (47.9) TFLOPs ของ FP64 & FP32 คำนวณแรงม้า เมื่อเทียบกับ Instinct MI100 ซึ่งเพิ่มขึ้น 4.16 เท่าใน กลุ่ม FP64 อันที่จริง หมายเลข FP64 ของ MI200 นั้นเกินประสิทธิภาพของ FP32 ของรุ่นก่อน ย้ายไปยังหมายเลข FP16 และ BF16 เรากำลังดูประสิทธิภาพ 383 TFLOPs ที่บ้าคลั่ง สำหรับมุมมอง MI100 มีเพียง 92.3 TFLOPs ของประสิทธิภาพ BFloat16 สูงสุดและ 184.6 TFLOPs สูงสุด FP16 ประสิทธิภาพ

AMD Entry-Level Navi 24’RDNA 2’Radeon RX GPUs ที่ลือกันว่าสำหรับการเปิดตัว Q1, 120W Super-Clocked Design มุ่งเป้าไปที่ RTX 3050 Ti และ Intel ARC

ตาม HPCWire, AMD Instinct MI200 จะขับเคลื่อนซูเปอร์คอมพิวเตอร์ระดับบนสุด 3 ตัว ซึ่งรวมถึงระบบ Frontier ระดับ exascale ของสหรัฐอเมริกา ระบบ LUMI ก่อนระดับ exascale ของสหภาพยุโรป และระบบ Setonix petascale ของออสเตรเลีย การแข่งขันประกอบด้วย A100 80 GB ซึ่งมี 19.5 TFLOPs ของ FP64, 156 TFLOPs ของ FP32 และ 312 TFLOPs ของ FP16 พลังประมวลผล แต่เราน่าจะได้ยินเกี่ยวกับ GPU Hopper MCM ของ NVIDIA ในปีหน้า ดังนั้นจะมีการแข่งขันที่รุนแรงระหว่างผู้นำด้าน GPU สองตัวในปี 2022

นี่คือสิ่งที่คาดหวังจาก GPU’CDNA 2’ของ AMD Instinct MI200 Accelerator

ภายใน AMD Instinct MI200 เป็น GPU Aldebaran ที่มีไดย์สองอัน ตัวรองและตัวหลัก มันมีสองดายโดยแต่ละอันประกอบด้วยเครื่องยนต์ 8 shader รวมเป็น 16 SE’s Shader Engine แต่ละอันบรรจุ 16 CUs พร้อม FP64 อัตราเต็ม, FP32 ที่บรรจุและ Matrix Engine เจนเนอเรชั่นที่ 2 สำหรับการทำงาน FP16 และ BF16 ดายแต่ละอันประกอบด้วยหน่วยประมวลผล 128 ยูนิตหรือสตรีมโปรเซสเซอร์ 8192 ตัว คิดเป็นจำนวนรวม 220 ยูนิตหรือสตรีมโปรเซสเซอร์ 14,080 ตัวสำหรับชิปทั้งหมด Aldebaran GPU ยังขับเคลื่อนโดย XGMI interconnect ใหม่ ชิปเล็ตแต่ละตัวมีเอ็นจิ้น VCN 2.6 และตัวควบคุม IO หลัก

บล็อกไดอะแกรมของ GPU Aldebaran ที่ขับเคลื่อนโดย CDNA 2 ของ AMD ซึ่งจะขับเคลื่อนตัวเร่งความเร็ว Instinct MI200 HPC มองเห็น (เครดิตรูปภาพ: Locuza)

สำหรับ DRAM นั้น AMD ได้ใช้อินเทอร์เฟซ 8 แชนเนลซึ่งประกอบด้วยอินเทอร์เฟซ 1024 บิตสำหรับอินเทอร์เฟซบัสกว้าง 8192 บิต แต่ละอินเทอร์เฟซสามารถรองรับโมดูล 2GB HBM2e DRAM สิ่งนี้น่าจะทำให้เรามีความจุหน่วยความจำ HBM2e สูงสุด 16 GB ต่อสแต็ก และเนื่องจากมีทั้งหมดแปดสแต็ก จำนวนความจุทั้งหมดจะเป็น 128 GB มหันต์ นั่นคือ 48 GB มากกว่า A100 ซึ่งมีหน่วยความจำ HBM2e 80 GB ดูรูปภาพแบบเต็มของ GPU Aldebaran บน Instinct MI200 ได้ที่นี่

AMD Radeon Instinct Accelerators 2020

ชื่อส่วนเร่งAMD Instinct MI300AMD Instinct MI200AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6 GPU ArchitectureTBA (CDNA 3)Aldebaran (CDNA 2)Arcturus (CDNA 1)Vega 20Vega 20Vega 10Fiji XTPolaris 10 GPU Process Node โหนดขั้นสูง กระบวนการ Node7nm FinFET7nm FinFET7nm FinFMCET14nm FinFET28s )1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic)1 (Monolithic) GPU Cores28,160?14,080?768040963840409640962304 GPU Clock SpeedTBA~1700 MHz~1500 MHz1800 MHz1725 MHz1500 MHz1000 FP1237 MHz สูงสุด TFLOPs29.5 TFLOPs26.5 TFLOPs24.6 TFLOPs8.2 TFLOPs5.7 TFLOPs5.7 TFLOPs FP32 ComputeTBA95.8 TFLOPs23.1 TFLOPs14.7 TFLOPs13.3 TFLOPs12.3 TFLOPs8.2 TFLOPs5.7 TFLOPs5.7 TFLOPs FP64 ComputeTBA47.9 TFLOPs11.5 TFLOPs 7.4 TFLOPs6.6 TFLOPs768 GFLOPs512 GFLOPs384 GFLOPs VRAMTBA64/128 GB HBM2e?32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5 หน่วยความจำ ClockTBATBA1200 MHz1000 MHz1000 MHz945 MHz500 MHz175092-40bit บัสหน่วยความจำ 4096bit bus4096-bit bus256-bit bus แบนด์วิดท์หน่วยความจำTBA~2 TB/s?1.23 TB/s1 TB/s1 TB/s484 GB/s512 GB/s224 GB/s ฟอร์มแฟกเตอร์TBADual Slot, Full Length/OAMDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Full LengthDual Slot, Half LengthSingle Slot, Full Length CoolingTBAPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive CoolingPassive Cooling TDPTBATBA300W300W300W300W175W150W

Categories: IT Info