Intel ได้เปิดตัวผู้สืบทอดรุ่นต่อไปอย่างเป็นทางการสำหรับเรือธง Xe GPU, Ponte Vecchio หรือที่รู้จักในชื่อ Rialto Bridge ชิปกราฟิกใหม่ได้รับการออกแบบสำหรับกลุ่มศูนย์ข้อมูล AI และ HPC รุ่นใหม่ โดยมุ่งเป้าไปที่โปรเซสเซอร์ CDNA และ NVIDIA ของ AMD
Intel Rialto Bridge GPU เปิดตัว: ตัวต่อจาก Ponte Vecchio ที่มีแกนเพิ่มขึ้น 25% Flops ที่เพิ่มขึ้น การกำหนดเป้าหมาย GPU สำหรับ AMD และ NVIDIA Data Center
Intel Rialto Bridge GPU นั้นถูกมองว่าเป็นเวอร์ชันอัปเกรดของ Ponte Vecchio ที่มีแกนประมวลผลมากขึ้น flop มากขึ้น แบนด์วิดท์มากขึ้น และ GT/s มากขึ้น Intel ไม่ได้เปิดเผยรายละเอียดมากนัก แต่อ้างว่า Rialto Bridge จะมีฟีเจอร์มากถึง 160 Xe cores เรายังไม่ทราบว่าสิ่งเหล่านี้เป็นคอร์เดียวกันกับ Ponte Vecchio GPU ปัจจุบันหรืออิงจากสถาปัตยกรรมใหม่ล่าสุด แต่ดูเหมือนว่าอย่างหลังอาจเป็นจริง
Intel Falcon Shores XPU To Push High-การคำนวณประสิทธิภาพสู่ขีดสุดด้วยการกำหนดค่า x86 CPU และ Xe GPU แบบหลายแผ่น โดยตั้งเป้าหมายที่ประสิทธิภาพมากกว่า 5 เท่าต่อวัตต์
วันนี้ เราขอเปิดตัวผู้สืบทอดตำแหน่งต่อจาก GPU ศูนย์ข้อมูลของโรงไฟฟ้าแห่งนี้ ซึ่งมีชื่อรหัสว่า Rialto Bridge. ด้วยการพัฒนาสถาปัตยกรรม Ponte Vecchio และการรวมไทล์ที่ได้รับการปรับปรุงเข้ากับเทคโนโลยีโหนดกระบวนการถัดไป Rialto Bridge จะนำเสนอความหนาแน่น ประสิทธิภาพ และประสิทธิภาพที่เพิ่มขึ้นอย่างมาก ในขณะที่ให้ความสม่ำเสมอของซอฟต์แวร์
ชื่อ Rialto Bridge ของ Intel ได้รับการตั้งชื่อว่า ตามหลังสะพานชื่อเดียวกันซึ่งเป็นสะพานที่เก่าแก่ที่สุดในสี่สะพานที่ทอดข้ามแกรนด์คาแนลในเมืองเวนิส ประเทศอิตาลี เช่นเดียวกับกรณีของ Ponte Vecchio และดูเหมือนว่ารุ่นต่อไปที่มาหลังจาก Rialto จะได้รับการตั้งชื่อตามสะพานที่เป็นสัญลักษณ์ด้วย ตามที่ Intel กล่าวไว้ Rialto Bridge GPU จะขับเคลื่อนโซลูชั่น AI & HPC Data Center รุ่นต่อไปในขณะที่มุ่งเป้าไปที่ตัวเร่ง AMD CDNA และ NVIDIA CUDA
ในแง่ของข้อกำหนด เรารู้แค่ว่า GPU Rialto Bridge สามารถรองรับแกน Xe ได้มากถึง 160 คอร์ในรูปแบบ OAM v2 ใหม่ล่าสุด แต่นอกเหนือจากการเปิดเผยข้อมูลจำเพาะแล้ว Intel ยังให้เราเห็นตัวชิปก่อนและมีบางสิ่งที่เราสามารถวิเคราะห์ได้ การเปลี่ยนแปลงครั้งใหญ่ที่สุดของ GPU อยู่ที่เลย์เอาต์ของ GPU ในขณะที่ Ponte Vecchio มี 16 Xe-HPC dies, แต่ละตัวมี 8 Xe cores สำหรับทั้งหมด 128 cores หรือ 16,384 ALUs, Rialto Bridge GPU มาพร้อมกับ 8 16 Xe-HPC dies ดังนั้นควรเป็น 20 Xe คอร์ต่อดายรวมเป็น 160 Xe คอร์ใน 8 ดาย ซึ่งเพิ่มขึ้นเป็น 20,480 ALU ซึ่งเพิ่มขึ้น 25 เปอร์เซ็นต์จากรุ่นก่อน
โครงสร้าง GPU Rialto Bridge ที่เหลือค่อนข้างเหมือนกับ Ponte Vecchio GPU ที่มี Xe Link Tiles สองชิ้น และ HBM Tiles แปดชิ้น (HBM3) ที่มีสแต็ค HBM สี่กองที่เชื่อมโยงกับไทล์คำนวณ (ดาย Xe HPC 4 อัน) นอกจากนี้ยังมีตัวทำให้แข็งแบบพาสซีฟอยู่รอบๆ ไทล์ Compute ในขณะที่ไทล์ Xe Link และ HBM3 เชื่อมต่อกับไทล์ Compute โดยใช้ไทล์ EMIB การเชื่อมต่อระหว่างชิป Foveros ถูกใช้โดย Compute Tile เพื่อสื่อสารกับ Xe Dies ที่เหลือ เราไม่ทราบรูปแบบที่แท้จริงของแต่ละไทล์ แต่ควรอิงตามการออกแบบ Foveros Omni (รุ่นที่ 3) ใหม่ นอกจากนี้ ดูเหมือนว่าไทล์ Rambo Cache จะหายไป แต่มีความเป็นไปได้สูงที่เมื่อเพิ่มขนาดไดย์ของไทล์ Compute แต่ละไทล์ ตอนนี้แคชจะแสดงบนไทล์ Compute เอง แทนที่จะแยกมันออกจากไทล์ของตัวเอง
ซีพียู”Xeon Scalable”ของ Intel Sapphire Rapids HBM ที่มีหน่วยความจำ HBM2e ขนาด 64 GB ให้ประสิทธิภาพเพิ่มขึ้นถึง 3 เท่าเมื่อเทียบกับ Ice Lake Xeons
สำหรับประสิทธิภาพนั้น Intel ยังไม่มี เปิดเผยตัวเลขที่ชัดเจนและระบุเพียงว่าเราควรคาดหวัง FOP ที่มากขึ้น GT/s และแบนด์วิดท์ที่เพิ่มขึ้น แบนด์วิดท์ที่เพิ่มขึ้นควรมาจากหน่วยความจำ HBM3 ที่อัปเกรดแล้ว Ponte Vecchio GPU นั้นมาพร้อมกับความจุ VRAM สูงสุด 128 GB ดังนั้นมันควรจะเป็นสิ่งที่เราเห็นใน GPU Rialto Bridge แต่ Intel สามารถซ้อนกันได้สูงยิ่งขึ้น
ต่อไปนี้คือ Intel Rialto ตัวเต็ม การกำหนดค่า Bridge die ที่เราสามารถวิเคราะห์ได้ในขณะนี้:
8 Xe HPC (ภายใน/ภายนอก) 2 Xe Base (ภายใน) 11 EMIB (ภายใน) 2 Xe Link (ภายนอก) 8 HBM (ภายนอก)
Intel ยังไม่มี ไม่ได้ระบุเวลาเผยแพร่หรือรายละเอียดเกี่ยวกับโหนดกระบวนการสำหรับ GPU Rialto Bridge แต่มีแนวโน้มว่าเราจะได้ยินข้อมูลเพิ่มเติมเกี่ยวกับมันในช่วงกลางปี 2023 เมื่อจะมีการสุ่มตัวอย่างให้กับลูกค้ารายแรกและการเปิดตัวที่มีเป้าหมายในช่วงปลายปี 2023 หรือ 1H ปี 2024
ตัวเร่งความเร็ว GPU สำหรับศูนย์ข้อมูลรุ่นถัดไป
<ตาราง >ชื่อ GPUAMD Instinct MI250XNVIDIA Hopper GH100Intel Ponte Vecchioการออกแบบบรรจุภัณฑ์ Intel Rialto BridgeMCM (Infinity Fabric)MonolithicMCM (EMIB + Foveros)MCM (EMIB + สถาปัตยกรรม GPUAldebaran (CDNA 2)Hopper GH100Xe-HPCXe-HPC GPU Process Node6nm4N7nm (Intel 4)5nm (Intel 3)? GPU Cores14,08016,89616,384 ALUs
(128 Xe Cores)20,480 ALUs
(160 Xe Cores) GPU Clock Speed1700 MHz~1780 MHzTBATBA L2/L3 Cache2 x 8 MB50 MB2 x 204 MBTBA FP16 Compute383 TOPsBA 2000 TFLOPsTBAT Compute95.7 TFLOPs1000 TFLOPs~45 TFLOPs (A0 Silicon)TBA FP64 Compute47.9 TFLOPs60 TFLOPsTBATBA ความจุหน่วยความจำ128 GB HBM2E80 GB HBM3128 GB HBM2e128 GB HBM3? นาฬิกาหน่วยความจำ3.2 Gbps3.2 GbpsTBATBA หน่วยความจำ Bus8192-bit5120-bit8192-bit8192-bit แบนด์วิดท์หน่วยความจำ 3.2 TB/s3.0 TB/s~3 TB/s~3 TB/s ฟอร์มแฟกเตอร์OAMOAMOAMOAM v2 CoolingPassive Cooling
Liquid CoolingPassive คูลลิ่ง
การระบายความร้อนด้วยของเหลวการทำความเย็นแบบพาสซีฟ
การระบายความร้อนด้วยของเหลวการทำความเย็นแบบพาสซีฟ
การระบายความร้อนด้วยของเหลว TDP560W700WTBDTBD LaunchQ4 20212H 20222022?2024?