ในขณะที่เริ่มเรียนรู้วิธี”double pumped”ของ AMD Zen 4 เพื่อรองรับ AVX-512 โดยใช้เส้นทางข้อมูล 256 บิต แต่ได้รับการพิสูจน์แล้วว่ามีประสิทธิภาพมากสำหรับ ประสิทธิภาพและให้ผลลัพธ์ที่ยอดเยี่ยมโดยไม่ทำให้นาฬิกาเสียหรือสร้างความเสียหายให้กับการใช้พลังงาน ย้อนกลับไปในเดือนกันยายน ฉันได้ส่งการวิเคราะห์ประสิทธิภาพ AVX-512 โดยละเอียดเกี่ยวกับ Ryzen 9 7950X ในขณะที่ในบทความนี้เป็นการเปรียบเทียบโดยละเอียดของ Core i9 11900K เทียบกับ Ryzen 7 7700X Core i9 11900K เป็นซีพียูเดสก์ท็อป Intel ตัวสุดท้ายในปัจจุบันที่สนับสนุน AVX-512 อย่างเป็นทางการ ในขณะที่ Ryzen 7 7700X ใช้สำหรับจับคู่จำนวนคอร์/เธรดของโปรเซสเซอร์ Rocket Lake นั้นสำหรับการเปรียบเทียบการเปิด/ปิด AVX-512
แม้ว่าโปรเซสเซอร์ Alder Lake รุ่นแรกจะอนุญาต AVX-512 หากปิดใช้งานแกน E การอัปเดต BIOS ของระบบจะปิดใช้งานความสามารถนั้นและถูกหลอมรวมในโปรเซสเซอร์ Alder Lake ในภายหลัง (และตอนนี้คือ Raptor Lake) ดังนั้นสำหรับการเปรียบเทียบประสิทธิภาพของ Intel กับ AMD AVX-512 ทางฝั่งเดสก์ท็อป หมายถึงการกลับไปใช้โปรเซสเซอร์ Core i9 11900K”Rocket Lake”ด้วยการสนับสนุน AVX-512 อย่างเป็นทางการ เพื่อเป็นการเตือนความจำ Core i9 11900K คือโปรเซสเซอร์ 8 คอร์/16 เธรดที่มีความถี่พื้นฐาน 3.5GHz และความถี่เทอร์โบสูงสุด 5.3GHz ในขณะที่มี TDP 125 วัตต์ที่โฆษณาไว้
สำหรับการทำงานกับ 8 คอร์/16 เธรด ในด้าน AMD นั้น Ryzen 7 7700X ถูกใช้ในขณะที่มีความถี่พื้นฐาน 4.5GHz และความเร็วสัญญาณนาฬิกาบูสต์สูงสุดที่ 5.4GHz และมี TDP เริ่มต้น 105 วัตต์
อย่างน้อยกับเมนบอร์ด AMD X670 ที่ฉันได้ทำการทดสอบจนถึงขณะนี้ยังไม่มีความสามารถในการปิดการใช้งาน AVX-512 จากภายใน BIOS ดังนั้นสำหรับการเปรียบเทียบเปิด/ปิดในทั้งสองระบบนี้ ฉันใช้”clearcpuid=304″ดังนั้นเคอร์เนล Linux จะไม่โฆษณาส่วนขยาย AVX-512 สำหรับแอปพลิเคชันที่ตรวจสอบสถานะ AVX-512 ผ่าน/proc/cpuinfo และยังป้องกันการใช้เคอร์เนลของ AVX-512 คำแนะนำ จากนั้นสำหรับการวัดประสิทธิภาพโอเพนซอร์สทั้งหมด พวกเขาถูกสร้างขึ้นใหม่ด้วย”-mno-avx512f”สำหรับการปิดใช้งานคำสั่ง AVX-512 เมื่อเทียบกับบิวด์ดั้งเดิมที่เปิดใช้งาน AVX-512
ทั้ง Intel Rocket Lake และระบบ AMD Zen 4 ได้รับการกำหนดค่าและทดสอบในทำนองเดียวกันโดยใช้ Ubuntu 22.10 กับเคอร์เนล Linux 5.19 เกณฑ์มาตรฐานที่มีความสามารถ AVX-512 ต่างๆ ได้รับการทดสอบแล้วทดสอบอีกครั้งโดยปิดใช้งานการรองรับ AVX-512 ในระหว่างการทดสอบ การใช้พลังงานคอร์ของ CPU ได้รับการตรวจสอบโดยใช้อินเทอร์เฟซ RAPL ที่เปิดเผย รวมทั้งการตรวจสอบความถี่สูงสุดของ CPU ที่ได้รับจากความถี่สัญญาณนาฬิกาสูงสุดที่พบทุกวินาทีบนแกนประมวลผลใดๆ
ต่อไปนี้คือข้อมูลสรุป ประสิทธิภาพของ AVX-512 Intel เทียบกับ AMD Linux ทางฝั่งเดสก์ท็อป และเพื่อเป็นการเตือนความจำ… หากคุณชอบการทดสอบฮาร์ดแวร์ Linux ข่าวสารโอเพนซอร์ซ ฯลฯ ที่ฉันทำทุกวันใน Phoronix โปรดพิจารณาเข้าร่วม Phoronix Premium เพื่อช่วยแสดงการสนับสนุนของคุณ อุตสาหกรรมโฆษณาและการใช้บล็อกโฆษณาที่อาละวาดค่อนข้างโหดร้ายเมื่อเร็ว ๆ นี้… Phoronix Premium ทำให้ไซต์ของคุณมีบทความแบบไม่มีโฆษณาและมีหลายหน้าในหน้าเดียว
อันดับแรกคือ AI-Benchmark และ สำหรับเกณฑ์มาตรฐานการฝึกอบรม AI พบว่า AVX-512 ดีขึ้นในซีพียูเดสก์ท็อปทั้งสอง… การเปิดใช้งาน AVX-512 ทำให้คะแนน Ryzen 7 7700X ดีขึ้น 70% ในขณะที่ประสิทธิภาพของโปรเซสเซอร์ Core i9 11900K เพิ่มขึ้น 61%
หรือเมื่อดูประสิทธิภาพการอนุมานของ AI โปรเซสเซอร์ Intel Rocket Lake จะถดถอยเมื่อเปิดใช้งาน AVX-512 ขณะที่คะแนนของโปรเซสเซอร์ AMD Zen 4 เพิ่มขึ้น 23%
เมื่อดูคะแนน”AI โดยรวม””จากแพ็คเกจซอฟต์แวร์นี้ ประสิทธิภาพ Core i9 11900K ดีขึ้น 27.5% เมื่อเปิดใช้งาน AVX-512 ขณะที่ Ryzen 7 7700X เพิ่มขึ้น 46%
ในเกณฑ์มาตรฐานเฉพาะนี้ AVX-512 ใช้กับ Rocket Lake ไม่ได้เพิ่มการใช้พลังงานอย่างมีนัยสำคัญเหมือนในภาระงานบางอย่าง การใช้พลังงานของ Ryzen 7 7700X นั้นใกล้เคียงกันระหว่างการวิ่งทั้งสองครั้ง
ด้วยโปรเซสเซอร์ทั้งสองนั้นมีประสิทธิภาพที่ดีต่อวัตต์ที่เพิ่มขึ้นด้วย AVX-512 ที่มีการวัดประสิทธิภาพ AI
ภาระงาน AI อื่น การใช้ AVX-512 ที่ได้รับการทดสอบคือ DeepSparse ของ Neural Magic
DeepSparse เพลิดเพลินกับประสิทธิภาพที่ดีขึ้นอย่างเห็นได้ชัดบนโปรเซสเซอร์ทั้งสองที่เปิดใช้งาน AVX-512 และการปรับปรุงที่ใกล้เคียงกันโดยประมาณในสถานะปิด AVX-512
แต่ในกรณีของ Intel Core i9 11900K ใช้พลังงานมากกว่า 13% ขึ้นไปเมื่อใช้ AVX-512 ในขณะเดียวกัน AMD Ryzen 7 7700X ก็แสดงการใช้พลังงานที่เท่ากันไม่ว่าจะเปิดใช้งาน AVX-512 หรือไม่
DeepSparse ของ Neural Magic แสดงให้เห็นถึงประโยชน์อย่างมากจาก AVX-512 สำหรับทั้งซีพียู Intel และ AMD ประสิทธิภาพของ AMD Zen 4 แสดงให้เห็นว่าการใช้งาน AVX-512″แบบ double pumped”นั้นยังคงมีประสิทธิภาพมาก และหากไม่มีการเพิ่มขึ้นอย่างมากใน Core i9 11900K
ซอฟต์แวร์ OpenRadioss ของ Altair แสดงให้เห็นถึงประโยชน์บางประการจาก AVX-512
เครื่องหมากรุก LeelaChessZero (LC0) ที่ขับเคลื่อนด้วย AI ก็สนุกกับ AVX-512 ด้วย Eigen แบ็คเอนด์ด้วยเช่นกัน ประสิทธิภาพของ AMD Ryzen 7 7700X เพิ่มขึ้น 11% โดย AVX-512 เป็น Core i9 11900K เพิ่มขึ้น 12%
แต่ด้วย LC0, AVX-512 ที่ใช้ CPU Rocket Lake ทำให้สิ้นเปลืองพลังงานเพิ่มขึ้น 23% และการใช้พลังงานสูงสุดก็เพิ่มขึ้น 23% เช่นกัน ไม่มีความแตกต่างด้านพลังงานที่สำคัญกับ Ryzen 7 7700X ซึ่งทำให้ประสิทธิภาพต่อวัตต์เพิ่มขึ้นที่ดีเมื่อเปิดใช้งาน AVX-512
ด้วยไลบรารีเคอร์เนล Embree ray-tracing ของ Intel ทำให้ AMD Zen 4 สามารถ เพื่อให้ได้รับประโยชน์จาก AVX-512 ที่มากกว่า Core i9 11900K มาก
แม้ว่า Core i9 11900K จะได้รับประโยชน์เพียงเล็กน้อยจาก AVX-512 สำหรับ Embree แต่การใช้พลังงานก็สูงขึ้นอย่างเห็นได้ชัดเมื่อใช้ AVX-512
ไลบรารีเคอร์เนลโวลุ่ม OpenVKL ของ Intel ได้รับประโยชน์อย่างมากจาก AVX-512 สำหรับทั้งซีพียูเดสก์ท็อป Intel และ AMD
แต่ในกรณีของประสิทธิภาพต่อวัตต์ AMD Zen โปรเซสเซอร์ 4 มีรูปร่างที่ดีขึ้นและใช้พลังงานน้อยลงเล็กน้อยเมื่อเทียบกับการใช้พลังงานที่เพิ่มขึ้นอย่างรวดเร็วของ i9-11900K
กลไกการติดตามรังสี OSPRay ของ Intel ยังได้รับการปรับให้เหมาะสมสำหรับ AVX-512 ด้วย Xeon ที่ตั้งใจไว้ การใช้ซีพียู ซีพียูเดสก์ท็อปทั้งสองได้รับประโยชน์จากการเปิดใช้งาน AVX-512 แต่อีกครั้งสำหรับ Rocket Lake นั้นหมายถึงการใช้พลังงานที่สูงขึ้นอย่างเห็นได้ชัด
แพ็คเกจซอฟต์แวร์ OSPRay Studio ของ Intel มีไว้สำหรับผู้สร้างที่ต้องการการแสดงภาพเชิงโต้ตอบแบบ Ray-traced ได้รับการปรับปรุงที่ดีเมื่อเปิดใช้งาน AVX-512
เวลาเรนเดอร์ที่เร็วขึ้นด้วยการเปิดใช้งาน AVX-512 นั้นยอดเยี่ยม แต่สำหรับ Core i9 11900K มันหมายถึงการใช้พลังงานที่สูงขึ้น ในขณะที่ Ryzen 7 7700X สามารถเพิ่มประสิทธิภาพได้ด้วยงบประมาณด้านพลังงานเท่าเดิม
แพ็คเกจซอฟต์แวร์ oneDNN ของ Intel ซึ่งเป็นส่วนประกอบอื่นของชุดซอฟต์แวร์ oneAPI ได้รับการปรับให้เหมาะสมสำหรับ AVX-512 เนื่องจากจุดประสงค์ของ Xeon AMD Ryzen 7 7700X ยังคงแสดงประสิทธิภาพที่ยอดเยี่ยมที่นี่และการปรับปรุงที่เกี่ยวข้องจากการเปิดใช้ AVX-512
ไม่จำเป็นต้องพูด Ryzen 7 7700X แสดงการใช้พลังงานที่ใกล้เคียงกันโดยไม่คำนึงถึงสถานะ AVX-512 ในขณะที่ Core i9 11900K มีประสิทธิภาพเพิ่มขึ้นด้วยต้นทุนพลังงานที่เพิ่มขึ้น
AVX-512 ช่วยประสิทธิภาพการเข้ารหัสลับอย่างมากสำหรับการทดสอบจำนวนมากภายใน Cpuminer-opt ทั่วกระดานมีการปรับปรุงที่ยอดเยี่ยมสำหรับซีพียูทั้งสองที่เปิดใช้งาน AVX-512 ในขณะที่มีเพียงซีพียู AMD Zen 4 เท่านั้นที่สามารถให้ผลลัพธ์เหล่านี้ได้โดยไม่ต้องเพิ่มพลังอย่างมาก
ผลลัพธ์ AVX-512 ที่ยอดเยี่ยมด้วยการทำเหมือง CPU/เกณฑ์มาตรฐานการเข้ารหัสลับ
ผู้รับประโยชน์อีกรายหนึ่งของ AVX-512 คือซอฟต์แวร์ Mobile Neural Network (MNN) จากอาลีบาบา
ระหว่างการเปรียบเทียบ MNN การใช้พลังงานของ Core i9 11900K เพิ่มขึ้น 13% ในขณะที่การใช้พลังงาน Ryzen 7 7700X ไม่ได้เพิ่มขึ้น
มันก็เป็นเรื่องที่คล้ายกันกับ NCNN ของ Tencent ด้วย
ความประหลาดใจเล็กน้อยกับการวัดประสิทธิภาพ AI เหล่านี้ทั้ง Core i9 11900K และ Ryzen 7 7700X แสดงให้เห็นถึงการปรับปรุงประสิทธิภาพที่สำคัญเมื่อเปิดใช้งาน AVX-512 นี่เป็นข่าวดีโดยเฉพาะสำหรับ AMD Zen 4 สำหรับการพิสูจน์แนวทาง”double pumped”ว่ามีประสิทธิภาพมากในการให้ผลกำไรที่ใกล้เคียงหรือมากกว่าที่พบในการสลับ AVX-512 บน Rocket Lake
และ แล้วสิ่งที่น่าตื่นเต้นมากสำหรับ AMD Zen 4 คือประสิทธิภาพที่เพิ่มขึ้นของ AVX-512 โดยไม่ต้องเพิ่มค่าพลังงานของคุณ
OpenVINO ยังใช้ AVX-512 อย่างมีประสิทธิภาพมาก และสามารถช่วยเพิ่มประสิทธิภาพ AI สำหรับซีพียูเดสก์ท็อปเหล่านี้ได้ ด้วย OpenVINO สำหรับกรณีทดสอบบางกรณี ประสิทธิภาพของ AVX-512 บน Intel Core i9 11900K ถดถอยเนื่องจากผลกระทบด้านพลังงาน/ความร้อน ในขณะเดียวกัน Ryzen 7 7700X ก็ให้ผลลัพธ์ที่ดีขึ้นอย่างต่อเนื่องโดยเปิดใช้งาน AVX-512 ไว้
ผลลัพธ์ของ Ryzen 7 7700X AVX-512 นั้นได้รับการสนับสนุนอย่างมากจาก ONNX ของ Microsoft ผลลัพธ์ของ Rocket Lake ที่มีการเปิด/ปิด AVX-512 นั้นผสมกัน
Numpy สนุกกับการเพิ่มความเร็วเล็กน้อย ~10% เมื่อเปิดใช้งาน AVX-512
เมื่อมองไปที่จุดสูงสุด ความถี่ของ CPU ทุกวินาทีตลอดระยะเวลาของการวัดประสิทธิภาพ จุดสูงสุดโดยเฉลี่ยของ Core i9 11900K นั้นไม่แตกต่างจากสถานะปิด AVX-512 มากนัก แต่ดังที่แสดงในบ็อกซ์พล็อต มีความแตกต่างที่ชัดเจนในบางครั้งที่กระทบถึงจุดสูงสุดที่ต่ำกว่ามาก กว่าเมื่อ AVX-512 ถูกปิดใช้งาน ในขณะเดียวกันความถี่สูงสุดของ CPU ก็ไม่ได้แตกต่างกันมากนักใน Ryzen 7 7700X โดยไม่คำนึงถึงสถานะ AVX-512 ซึ่งคล้ายกับการเปรียบเทียบ AVX-512 ก่อนหน้าของฉันใน Ryzen 9 7950X
เมื่อพิจารณาถึงพลังของ CPU การบริโภคตลอดช่วงการวัดประสิทธิภาพ AVX-512 ที่ดำเนินการ Ryzen 7 7700X ไม่ได้ขยับเขยื้อนมากนัก การใช้พลังงาน Core i9 11900K เพิ่มขึ้นโดยเฉลี่ย 11% เมื่อเปิดใช้งาน AVX-512 และการใช้พลังงานสูงสุดก็เพิ่มขึ้น 12%
หากใช้ค่าเฉลี่ยเรขาคณิตของประสิทธิภาพ AVX-512 ดิบทั้งหมด ผลการวัดประสิทธิภาพ Core i9 11900K ดีขึ้น 31% เมื่อเปิดใช้งาน AVX-512 ในขณะเดียวกัน Ryzen 7 7700X ก็เห็นว่าประสิทธิภาพดีขึ้น 44% เมื่อเปิดใช้งาน AVX-512
พูดง่ายๆ ว่าฉันยังคงประทับใจมากกับการใช้งาน AVX-512 ของ AMD กับ Zen 4 ในทุกเวิร์กโหลดที่ฉัน ได้รับการทดสอบ ยอดเยี่ยมเช่นกันที่ได้เห็น AVX-512 รองรับโปรเซสเซอร์ AMD Zen 4 ทั้งหมด
ดูการตรวจสอบ Core i9 13900K Linux ของฉัน และการตรวจสอบ Core i5 13600K Linux สำหรับการเปรียบเทียบ CPU Raptor Lake ล่าสุดของ Intel กับ AMD Zen 4 หากสงสัยเกี่ยวกับประสิทธิภาพของ CPU ล่าสุดโดยรวมมากกว่าที่จะแยกเป็น AVX-512