EPYC 9654 เป็นโปรเซสเซอร์รุ่นใหม่ของ AMD ที่มี 96 คอร์/192 เธรด นาฬิกาฐาน 2.4GHz พร้อมนาฬิกาเร่งความเร็ว 3.7GHz และมี TDP 360 วัตต์ TDP ที่กำหนดค่าได้ในส่วน 96 core เดียวนี้มีตั้งแต่ 320 ถึง 400 วัตต์

EPYC 9554 ในขณะเดียวกันก็เป็นชิ้นส่วน 64-core ระดับสูงกว่าของ AMD เหนือ EPYC 9534 9554 รองรับ 64 คอร์/128 เธรด พร้อมนาฬิกาพื้นฐาน 3.1GHz และนาฬิกาบูสต์ 3.75GHz ในขณะที่มี TDP 360 วัตต์ เช่น EPYC 9654 เช่นเดียวกับ EPYC 9654 cTDP สามารถปรับได้ตั้งแต่ 320 ถึง 400 วัตต์ โปรเซสเซอร์มิลานรุ่นเรือธงปัจจุบัน EPYC 7763 เป็นการเตือนความจำคือ 64 คอร์/128 เธรด พร้อมนาฬิกาพื้นฐาน 2.45GHz และนาฬิกาบูสต์สูงสุด 3.5GHz หรือฝั่ง Milan-X คือ EPYC 7773X ที่มีนาฬิกาพื้นฐาน 2.2GHz และนาฬิกาบูสต์สูงสุด 3.5GHz ขณะที่มีแคช L3 อยู่ที่ 768MB

AMD EPYC 9374F 32-core high frequency part ที่ออกมาในการตรวจสอบแยกต่างหากมี base clock ที่ 4.05GHz และเพิ่ม 4.3GHz ในขณะที่มี 320 Watt TDP

EPYC 9654 มี ราคาเปิดตัวประมาณ 11,805 ดอลลาร์ EPYC 9554 จะขายปลีกที่ราคาประมาณ 9,087 ดอลลาร์สหรัฐฯ และ EPYC 9374F ประมาณ 4,850 ดอลลาร์

การเปรียบเทียบขนาดของ AMD Milan SP3 บน AMD Genoa SP5

AMD ขอความกรุณาให้แพลตฟอร์มอ้างอิง Titanite และโปรเซสเซอร์ EPYC 9004 Genoa สำหรับการตรวจสอบนี้และการวัดประสิทธิภาพ Linux สำหรับการตรวจสอบการเปิดตัวของวันนี้ โปรเซสเซอร์ของเซิร์ฟเวอร์ที่ทดสอบรวมอยู่ด้วย:

-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P

โปรเซสเซอร์ทั้งหมดได้รับการทดสอบใหม่/ทดสอบใหม่โดยใช้ Ubuntu 22.10 พร้อมเคอร์เนล Linux 6.0 และ GCC 12. รายละเอียดเพิ่มเติมเกี่ยวกับชุดซอฟต์แวร์ด้านล่าง

สำหรับโปรเซสเซอร์ EPYC Genoa ใหม่ ฉันได้ทดสอบ EPYC 9554 และ 9654 ทั้งในโหมดการกำหนด”ประสิทธิภาพ”เริ่มต้นและใน ไบออสสลับไปใช้โหมดการกำหนด”กำลัง”สำหรับผู้ที่สงสัยเกี่ยวกับผลกระทบด้านประสิทธิภาพโดยรวมของการควบคุมการกำหนดระดับจากไบออส คำต่อท้าย”-พลัง”ผลลัพธ์ของเจนัวเกิดขึ้นเมื่อทำงานในโหมดการกำหนดพลังงานเหนือค่ากำหนดประสิทธิภาพเริ่มต้น การตั้งค่า BIOS อื่น ๆ ทั้งหมดสำหรับโปรเซสเซอร์ Intel/AMD ที่ทดสอบแต่ละตัวนั้นเป็นค่าเริ่มต้นตามลำดับ การทดสอบทั้ง 1P และ 2P ดำเนินการกับโปรเซสเซอร์ที่ทดสอบทั้งหมดที่มีทั้งหมด

เมื่อพิจารณาจาก”ขอบตก”ตามปกติของฉันและการมุ่งเน้นที่การมองไปข้างหน้า การวัดประสิทธิภาพทั้งหมดเหล่านี้จึงถูกดำเนินการ จาก Ubuntu 22.10 พร้อมคอมไพเลอร์หุ้น GCC 12.2 เพื่อรูปลักษณ์ใหม่ของเคอร์เนล ลินุกซ์ 6.0 ถูกใช้งานอยู่ สแต็คซอฟต์แวร์เดียวกันนี้ถูกใช้ในเซิร์ฟเวอร์/โปรเซสเซอร์ทั้งหมดที่ทดสอบ การกำหนดค่าแต่ละรายการกำลังทำงานด้วยหน่วยความจำที่ความเร็วสูงสุดและการกำหนดค่าช่องหน่วยความจำ CPU ทั้งหมดได้รับการทดสอบโดยใช้”ประสิทธิภาพ”ของผู้ว่าการปรับขนาดความถี่ของ CPU

Ubuntu 22.04 LTS แม้ว่าจะอยู่ในสภาพที่ดีสำหรับ EPYC Genoa เช่นกัน และฉันได้ทดสอบโปรเซสเซอร์ EPYC 9004 ซีรีส์เหล่านี้บน Ubuntu 22.04 ด้วย เคอร์เนลลินุกซ์ 5.15 ของมัน แต่สำหรับการดูประสิทธิภาพของลีนุกซ์ที่มองไปข้างหน้าและต้องการใช้ซอฟต์แวร์อัปสตรีมล่าสุด การเปรียบเทียบรอบนี้เสร็จสิ้นด้วย Ubuntu 22.10 + Linux 6.0 ในทุกโปรเซสเซอร์ของเซิร์ฟเวอร์ที่ทดสอบแล้ว

ไม่ต้องแปลกใจเลยที่โปรเซสเซอร์ AMD EPYC 9004″Genoa”ที่รองรับ Linux นั้นอยู่ในสภาพที่ดีสำหรับการเปิดตัว การใช้การแจกจ่ายที่มีเคอร์เนล Linux เวอร์ชันล่าสุด (หรือการกระจาย Linux ระดับองค์กรที่มีเคอร์เนลแบบ back-ported/patched) ควรอยู่ในสภาพที่ดีสำหรับโปรเซสเซอร์เซิร์ฟเวอร์ Zen 4 เหล่านี้ มีคุณสมบัติบางอย่างที่เพิ่งมาถึงเมื่อเร็ว ๆ นี้เช่นการจัดการ Last Branch Record ที่อัปเดต แต่ฟังก์ชันหลักทั้งหมดมีอยู่แล้ว-รวมถึงการตรวจสอบอุณหภูมิและการใช้พลังงาน ทางด้านคอมไพเลอร์ การสนับสนุน Zen 4 (znver4) นั้นล่าช้า AMD เพิ่งโพสต์แพตช์การเปิดใช้งาน Znver4 เริ่มต้นในขณะที่ดำเนินการตารางต้นทุนจาก Znver3 การสนับสนุนเริ่มต้นดังกล่าวจะพบได้ใน GCC 13 ซึ่งจะเปิดตัวในช่วงต้นปีหน้า และการสนับสนุน LLVM/Clang 16.0 อยู่ระหว่างรอดำเนินการ คาดว่า AMD จะออก AOCC รุ่นใหม่ในเร็วๆ นี้สำหรับ AMD Optimizing C/C++ Compiler พร้อมการปรับให้เหมาะสมของ Zen 4

ระหว่างการเปรียบเทียบ การทดสอบเซิร์ฟเวอร์/HPC ที่มีให้เลือกมากมายได้ดำเนินการไปพร้อมกับตรวจสอบพลังงานของ CPU การบริโภคจากอินเทอร์เฟซ RAPL ที่เปิดเผยและให้การวัดประสิทธิภาพต่อวัตต์ต่อ benchmark และอีกมากมาย

ทันทีที่เริ่มต้นการวัดประสิทธิภาพ HPC บางส่วน โปรเซสเซอร์ AMD EPYC Genoa แสดงให้เห็นถึงความกล้าหาญในประสิทธิภาพ AMD EPYC 9654 2P มีรันไทม์ที่ต่ำกว่า 40% สำหรับรหัส GPAW DFT เมื่อเทียบกับ EPYC 7773X Milan-X และกำลังใกล้ถึงจุดที่จะเร็วเป็นสองเท่าของโปรเซสเซอร์ EPYC 7763 เมื่อเปลี่ยนไปใช้โหมดกำหนดกำลังไฟฟ้า โปรเซสเซอร์ EPYC Genoa ได้ลดประสิทธิภาพการทำงานลง ไม่ใช่แค่ 96 คอร์เทียบกับ 64 คอร์ที่นำไปสู่การยกระดับครั้งใหญ่ด้วยเจนัวเนื่องจากประสิทธิภาพของ 64-core EPYC 9554 1P2P นั้นเป็นตัวเอกเช่นกัน-EPYC 9554 ตรงกับประสิทธิภาพ EPYC 7763 2P สำหรับ GPAW!

แต่ แน่นอน โปรเซสเซอร์ EPYC 9554/9654 ใหม่เหล่านี้ใช้พลังงานมากกว่ารุ่นก่อนอย่างที่คาดไว้

โดยพิจารณาจากประสิทธิภาพต่อดอลลาร์ โปรเซสเซอร์ EPYC 9554/9654 ใหม่ทำงานได้ดีทีเดียว กับชิ้นส่วนรุ่นก่อน แน่นอน นั่นเป็นเพียงราคาของ CPU แต่ยังมีราคาหน่วยความจำ DDR5 และราคาแพลตฟอร์มที่ต้องพิจารณาด้วย แต่ไม่สามารถประเมินได้อย่างแม่นยำก่อนเปิดตัวเพื่อดูว่าราคามาเธอร์บอร์ดของ Genoa ฯลฯ จะเปรียบเทียบอย่างไร สู่ Milan(X)

ประสิทธิภาพของ AMD EPYC 9654 และ EPYC 9554 นั้นยอดเยี่ยมพอๆ กันกับเกณฑ์มาตรฐาน GROMACS พลวัตระดับโมเลกุล ประสิทธิภาพของ EPYC 9654 2P คือ 1.66x ของความเร็วของ EPYC 7773X 2P และการกำหนดค่า EPYC 9654 1P ที่เกือบจะตรงกับประสิทธิภาพของ EPYC 7773X 2P… มีการเพิ่มขึ้นอย่างมากด้วยคอร์เพิ่มเติม, หน่วยความจำระบบ DDR5, ช่องหน่วยความจำ 12 ช่อง, AVX-512 และการปรับปรุงสถาปัตยกรรม Zen 4 อื่นๆ และหากทำงานในโหมดกำหนดกำลังไฟฟ้า ประสิทธิภาพจะสูงขึ้นอีก

ในขณะที่การใช้พลังงานของ EPYC เจนัวสูงกว่า EPYC Milan(X) และ Xeon Ice Lake โดยอิงตามประสิทธิภาพต่อวัตต์สำหรับ GROMACS ประสิทธิภาพพบได้กับเจนัว โปรเซสเซอร์ Xeon Platinum 8380 รุ่นเรือธงของ Intel นั้นไม่สามารถแข่งขันกับเจนัวได้ และมีเวลาเพียงพอในการทำงานกับ Milan(X) ในการวัดประสิทธิภาพส่วนใหญ่ แต่อย่างน้อย Xeon Sapphire Rapids ก็หวังว่าจะมาถึงในไตรมาสหน้า

ประสิทธิภาพต่อ-ตัวชี้วัดดอลลาร์ที่อิงตามราคาของ CPU ทำให้เจนัวอยู่ในสภาพที่ดี

โปรเซสเซอร์ EPYC Genoa ที่ผ่านการทดสอบนั้นทำงานได้ดีอย่างไม่น่าเชื่อกับ NAMD และให้ผลลัพธ์ที่ยอดเยี่ยมในรุ่นต่างๆ จาก Milan/Milan-X และขยายความเป็นผู้นำเหนือรุ่นปัจจุบัน โปรเซสเซอร์ Xeon Ice Lake

AMD EPYC Genoa ทำได้ยอดเยี่ยมด้วยการวัดประสิทธิภาพ Graph500

ผลลัพธ์ EPYC 9654/9554 ก็น่าทึ่งสำหรับเกณฑ์มาตรฐาน HPCG ด้วย พูดง่ายๆ ก็คือ ซีรีส์ AMD EPYC 9004 ผ่านการวัดประสิทธิภาพที่หลากหลายนั้นให้การอัปเกรดประสิทธิภาพที่ไม่เคยมีมาก่อนอย่างต่อเนื่อง

โปรเซสเซอร์ EPYC 9554 และ EPYC 9654 มีประสิทธิภาพที่ยอดเยี่ยมพร้อมการพยากรณ์อากาศโดยใช้ WRF การยกระดับจาก EPYC 7773X/7763 ไปเป็น EPYC 9654 นั้นไม่น่าประหลาดใจนัก แต่แม้แต่ EPYC 9554 แบบ 64 คอร์ก็มีข้อได้เปรียบอย่างมาก เนื่องจาก AVX-512 และการปรับปรุงอื่นๆ เหนือโปรเซสเซอร์เซิร์ฟเวอร์ Zen 3 รุ่นก่อน

เปิด ตามประสิทธิภาพต่อดอลลาร์ด้วย WRF โปรเซสเซอร์ EPYC Genoa ยังคงส่องแสงอย่างต่อเนื่อง

ด้วย RELION การปรับปรุงรุ่นต่างๆ น้อยลงแต่ยังคงมีนัยสำคัญตั้งแต่มิลาน (X) ถึงเจนัว

AMG เป็นหนึ่งในเกณฑ์มาตรฐานไม่กี่ข้อที่โปรเซสเซอร์ Xeon Platinum 8362/8380 Ice Lake สามารถก้าวล้ำหน้าโปรเซสเซอร์รุ่นเรือธง EPYC Milan ได้ แต่นั่นไม่ใช่กรณีของ Genoa อีกต่อไป

ในขณะที่มีการใช้พลังงานสูงกว่า EPYC โปรเซสเซอร์ Genoa ให้ประสิทธิภาพการใช้พลังงานที่ยอดเยี่ยม

จากการวัดประสิทธิภาพ HPC ที่หลากหลาย ประสิทธิภาพของโปรเซสเซอร์ EPYC Genoa นั้นยอดเยี่ยมมาก ในช่วงไม่กี่สัปดาห์ที่ผ่านมาของการวิ่ง EPYC Genoa เป็นผลลัพธ์การวัดประสิทธิภาพที่น่าสนใจที่สุดเท่าที่ฉันเคยเห็นมาในช่วง 18+ ปีที่ผ่านมาด้วยการยกระดับรุ่นที่น่าทึ่งในขณะที่ยังคงมอบประสิทธิภาพและมูลค่าด้านพลังงานชั้นนำ

จากทั่วๆ ไป การวัดประสิทธิภาพ HPC ที่หลากหลาย การกำหนดค่า EPYC 9654 และ 9554 ให้ประสิทธิภาพที่ยอดเยี่ยมในโหมดการกำหนดประสิทธิภาพเริ่มต้น

OpenVINO สำหรับโปรเจ็กต์ซอฟต์แวร์ AI แบบโอเพนซอร์สของ Intel มีประสิทธิภาพที่ยอดเยี่ยมใน AMD EPYC 9004″เจนัว”โปรเซสเซอร์ที่มี AVX-512 โปรเซสเซอร์ Xeon Platinum 8362/8380 ให้ประสิทธิภาพที่ดีกว่า CPU Milan/Milan-X ด้วย AVX-512 แต่การใช้งาน AVX-512 ของ Genoa ทำให้ OpenVINO มีประสิทธิภาพที่สูงขึ้นมาก

การยกระดับด้วย OpenVINO สำหรับเจนัวนั้นน่าทึ่งมากจนค่าประสิทธิภาพต่อดอลลาร์นั้นเหนือกว่าซีพียู Intel/AMD ที่มีอยู่

OpenVINO เป็นฐานที่มั่นสำหรับ Intel Xeon Scalable”Ice Lake”เหนือ Milan/Milan-X แต่โปรเซสเซอร์ EPYC 9554″Genoa”สามารถแข่งขันกับโปรเซสเซอร์ Xeon Platinum 8380 ได้สองตัว ประสิทธิภาพที่ออกมาจากเจนัวนั้นแย่มาก

จากการทดสอบรุ่นต่างๆ มากมาย OpenVINO 2022 ทำงานได้ดีเยี่ยมด้วยโปรเซสเซอร์ EPYC Genoa เนื่องจากการรองรับ AVX-512 แม้ว่าในตอนแรก ฉันรู้สึกกังวลเกี่ยวกับการนำ AVX-512 ของ Zen 4 ไปใช้โดยใช้เส้นทางข้อมูล 256 บิต แต่ก็ได้รับการพิสูจน์แล้วว่าทำงานได้ดีมาก และไม่มีผลกระทบด้านพลังงาน/ความร้อนของ AVX-512 ในซีพียู Intel รุ่นก่อนหน้า

โปรเซสเซอร์ EPYC Genoa ยังทำงานได้ดีมากกับไลบรารีเครือข่าย oneDNN deep neural ของ Intel ที่สามารถใช้ AVX-512 ได้อย่างกว้างขวาง

แม้แต่งาน”ธรรมดา”เช่น การคอมไพล์โค้ดในหลายงานเพื่อทำให้อิ่ม ซีพียู, ประสิทธิภาพของซีรีส์ AMD EPYC 9004 ยังคงให้การปรับปรุงรุ่นที่มีขนาดใหญ่กว่ามิลาน

ข้อได้เปรียบในการนับคอร์ของ AMD EPYC ก็ช่วยได้เช่นกันและเป็นพื้นที่ที่ EPYC Genoa จะยังคงเป็นผู้นำในโปรเซสเซอร์ Sapphire Rapids ที่กำลังจะมีขึ้นของ Intel

โปรเซสเซอร์ Genoa ระดับไฮเอนด์รุ่นใหม่สามารถคอมไพล์การสร้างเคอร์เนล Linux x86_64 เริ่มต้นได้ภายในเวลาไม่ถึง 20 วินาที!

หรือสร้างเคอร์เนลแบบเต็มด้วยโมดูลเคอร์เนลที่มีอยู่ทั้งหมดสามารถทำได้ภายใต้ สองนาที

ตามผลงานต่อดอลลาร์ ผลลัพธ์ EPYC Genoa s เทียบได้กับราคามิลานปัจจุบันสำหรับมูลค่าหากสนใจในการรวบรวมโค้ด build farm/เซิร์ฟเวอร์ CI

สำหรับฟาร์มเรนเดอร์ที่ใช้ CPU, AMD EPYC Genoa ที่มีมากถึง 96 คอร์และการปรับปรุงการออกแบบเหนือ Zen 3 ได้รับผลตอบแทนด้วยการปรับปรุงเวลาในการแสดงผลที่สำคัญ ด้วยฉาก BMW ที่รู้จักกันดี โปรเซสเซอร์ EPYC 9654 2P รุ่นเรือธงสามารถแสดงผลได้ในเวลาเพียง 8 วินาที!

AMD EPYC Genoa ทำงานได้ดีมากกับ Blender 3.3 พร้อมการปรับปรุงรุ่นใหญ่และประสิทธิภาพที่ดีกว่าที่ทำได้มาก ทำได้ด้วย Xeon Scalable Ice Lake และจำนวนคอร์ที่ต่ำกว่ามาก

โหมดการกำหนดพลังงานสามารถช่วยในการแสดงผล Blender ได้มากขึ้น ถ้าคุณไม่คำนึงถึงพลังงานที่เพิ่มขึ้น/ผลกระทบจากความร้อน

โดยอิงตามประสิทธิภาพต่อดอลลาร์ อย่างน้อย Genoa CPU รุ่นใหม่สามารถเทียบราคากับ Milan ได้ในระดับ CPU อย่างน้อย

Intel’s Embree ray-tracing kernels สามารถได้รับประโยชน์อย่างมากจาก เจนัวกับ AVX-512 EPYC 9654 2P ในโหมดกำหนดพลังงานมีความเร็วเป็นสองเท่าของโปรเซสเซอร์ AMD EPYC 7773X 2P

ในขณะที่โปรเซสเซอร์ Genoa ที่ทดสอบมีการใช้พลังงานสูงกว่ามิลาน โดยพิจารณาจากประสิทธิภาพต่อวัตต์ที่พวกเขาทำ ดีกว่าซีพียู Intel/AMD อื่นๆ มาก

เจนัวทำงานได้ดีในส่วนประกอบซอฟต์แวร์อื่นๆ ของ Intel ที่ปรับให้เหมาะสม AVX-512 ซึ่งเป็นส่วนหนึ่งของคอลเลกชัน oneAPI

รังสี OSPRay-เอ็นจิ้นการติดตามได้รับชัยชนะด้วยโปรเซสเซอร์ Xeon Platinum 8380/8662 เหนือ Milan/Milan-X แต่นั่นไม่ใช่กรณีของเจนัวอีกต่อไป เนื่องจาก OSPRay ได้รับการปรับแต่งอย่างดีจาก Intel สำหรับ AVX-512 ที่ใช้กับ Xeon CPUs จึงทำงานได้ดีพอๆ กันกับโปรเซสเซอร์เซิร์ฟเวอร์ AVX-512 ใหม่ของ AMD

สำหรับปริมาณงานการเรนเดอร์ที่ใช้ CPU ผลลัพธ์ของ Genoa นั้นยอดเยี่ยมมากโดยเฉพาะ ในกรณีเช่น EPYC 9654 ตัวเดียวที่สามารถทำงานได้ดีกว่าการกำหนดค่า 2P EPYC 7773X หรือ 2P 7763

ในเกณฑ์มาตรฐาน Node.js แบบเธรดเดียว ตอนนี้เจนัวสามารถก้าวขึ้นมานำหน้า Ice Lake ได้ด้วย การปรับปรุงสถาปัตยกรรม Zen 4

มาตรฐานการแยกวิเคราะห์ simdjson JSON มักไม่น่าสนใจสำหรับประสิทธิภาพของเซิร์ฟเวอร์ขนาดใหญ่ แต่ตอนนี้ simdjson มีเส้นทางที่ปรับให้เหมาะสม AVX-512 แล้ว โปรเซสเซอร์ซีรีส์ EPYC 9004 นำหน้า Ice Lake ไปมากในขณะนี้ด้วยการรองรับ Zen 4 AVX-512

การใช้พลังงานยังเทียบได้กับ Ice Lake โดยที่ CPU ยังไม่อิ่มตัวเต็มที่สำหรับเกณฑ์การแยกวิเคราะห์ JSON.

EPYC 9554 ให้ประสิทธิภาพต่อวัตต์ที่ดีที่สุดสำหรับการทดสอบการแยกวิเคราะห์ที่มีความสามารถ AVX-512 สำหรับข้อมูล JSON กิกะไบต์

การทดสอบประสิทธิภาพของ Python แบบเธรดเดียวยัง แสดงความก้าวหน้าที่ดีด้วย Zen 4

และการปรับปรุงที่ดีมากสำหรับ Numpy

ประสิทธิภาพ PHP แบบเธรดเดียวของเจนัวตอนนี้อยู่ในสถานะที่เทียบได้กับ Ice Lake เท่านั้น แต่สำหรับเว็บเซิร์ฟเวอร์ที่โหลดเต็มแล้ว แน่นอนว่ามีความจุมากกว่าในเจนัวและจำนวนคอร์/เธรดที่สูงกว่า

สำหรับเวิร์กโหลดทั่วไป เช่น การบีบอัดไฟล์/ข้อมูล Zen 4 กับ Genoa ให้การปรับปรุงที่ดีขึ้นบางส่วนบน Zen 3

เจนัวรวบรวมชัยชนะที่เป็นตัวเอกด้วย BRL-CAD

มีการเพิ่มระดับที่สำคัญใน enjo y กับ Genoa สำหรับซอฟต์แวร์ประมวลผลสัญญาณดิจิทัลแบบโอเพนซอร์ส Liquid-DSP

เรื่องสั้นจากการวัดประสิทธิภาพที่แตกต่างกันประมาณ 200 รายการที่ฉันทำ โปรเซสเซอร์ AMD EPYC 9654 และ EPYC 9554 ประสบความสำเร็จอย่างยอดเยี่ยม พวกเขาให้การยกระดับที่ยอดเยี่ยมโดยรวม แต่โดยเฉพาะอย่างยิ่งในเวิร์กโหลด HPC/เซิร์ฟเวอร์จำนวนมากที่สามารถใช้ประโยชน์จาก AVX-512 และทำให้ AMD เป็นผู้นำในวงกว้างขึ้นเหนือโปรเซสเซอร์ Xeon Scalable”Ice Lake”ในปัจจุบัน

ผลลัพธ์ OpenFOAM ด้วย EPYC เจนัวนั้นยอดเยี่ยมมากสำหรับ open-source computational fluid dynamics (CFD)

OpenRadioss ของ Altair ก็ดูดีมากสำหรับเจนัวเช่นกัน (ไม่ใช่ CPU ทั้งหมดที่ได้รับการทดสอบที่นี่เนื่องจากการเพิ่มเกณฑ์มาตรฐานใหม่นั้นช้ากว่ารอบการตรวจสอบการทดสอบ แต่เมื่อพิจารณาจากความสนใจจากโครงการโอเพนซอร์ซใหม่นี้จาก Altair ต่อไปนี้คือจุดอ้างอิงสำหรับ CPU ที่ทดสอบ)

Those wishing to see all of the benchmarks I ran in full can do so via เปิดตามข้อมูลทั้งหมดแล้ว ต่อประสิทธิภาพการทำงาน

ต่อประสิทธิภาพการทำงานนี้

ต่อประสิทธิภาพการทำงาน

ดูการใช้พลังงานรวมกันที่สังเกตได้จากการกำหนดค่าโปรเซสเซอร์ทั้งหมดภายใต้การทดสอบตลอดระยะเวลาของการวัดประสิทธิภาพ อีกครั้ง การวัดพลังงาน CPU ทั้งหมดมาจากอินเทอร์เฟซ RAPL ที่เปิดเผยบน Linux EPYC 9554 ในโหมดเริ่มต้น (การกำหนดประสิทธิภาพ) มีการดึงพลังงานเฉลี่ย 221 วัตต์ สูงสุด 355 วัตต์ เมื่อเทียบกับ EPYC 7763 ที่มีค่าเฉลี่ย 170 วัตต์ และสูงสุด 286 วัตต์ แต่เมื่อเปิดใช้โหมดกำหนดกำลังไฟฟ้า เพิ่มขึ้นเป็น 234 วัตต์โดยเฉลี่ยโดยมีจุดสูงสุดที่ 404 วัตต์ ในขณะเดียวกัน EPYC 9654 รุ่นเรือธง 96-core มีกำลังไฟเฉลี่ย 223 วัตต์และสูงสุด 363 วัตต์หรือเฉลี่ย 256 วัตต์ในโหมดกำหนดกำลังไฟฟ้าและมีสูงสุด 415 วัตต์ ในโหมด EPYC 9654 2P ที่มีค่าเฉลี่ย 366 วัตต์ และสูงสุดที่ 697 วัตต์ หรือในโหมดกำหนดกำลังไฟฟ้า เฉลี่ย 443 วัตต์ และสูงสุด 833 วัตต์ การใช้พลังงานนั้นสูงขึ้นด้วยโปรเซสเซอร์ Socket SP5 ใหม่เหล่านี้ แต่ดังที่แสดงโดยตัวชี้วัดประสิทธิภาพต่อวัตต์ เมื่อพูดถึงประสิทธิภาพการใช้พลังงาน มักจะนำหน้า AMD EPYC 7003″มิลาน”หรือกรณีที่เลวร้ายที่สุดคือประสิทธิภาพใกล้เคียงกัน ต่อวัตต์สำหรับชิ้นส่วนรุ่นก่อนๆ ดังนั้น การเพิ่มกำลังจึงสมเหตุสมผล และมีโปรเซสเซอร์ EPYC 9004″Genoa”ที่ต่ำกว่าด้วย หากไม่ต้องการเข้าสู่ช่วง 300~400 วัตต์

เมื่อใช้ค่าเฉลี่ยเรขาคณิตของเกณฑ์มาตรฐานทั้งหมดที่รันได้สำเร็จ โปรเซสเซอร์ทั้งหมด นี่คือสิ่งที่สั่นคลอน แม้แต่ EPYC 9554 ตัวเดียวก็ออกมาก่อนหน้าการกำหนดค่า 2P EPYC 7773X โดยรวม… AMD 4th Gen EPYC นั้นยอดเยี่ยมด้วยการใช้งาน AVX-512, หน่วยความจำระบบ DDR5, ช่องหน่วยความจำสิบสองช่อง และการปรับปรุงสถาปัตยกรรม Zen 4 อื่นๆ EPYC 9554 2P แบบ 64 คอร์นั้นเร็วกว่าการกำหนดค่า EPYC 7763 2P แบบ 64 คอร์โดยรวมถึง 64% หรือ 67% หากรัน EPYC 9554 2P ในโหมดกำหนดพลังงาน ในขณะเดียวกัน EPYC 9654 2P รุ่นเรือธงนั้นเร็วกว่า EPYC 7763 2P ถึง 74% หรือเพิ่มขึ้นถึง 85% เมื่อซีพียูรุ่นเรือธงของ Genoa ทำงานในโหมดกำหนดพลังงาน AMD EPYC 9654 2P ทำงานที่ความเร็วมากกว่า 2 เท่าของโปรเซสเซอร์รุ่นเรือธงปัจจุบันของ Intel นั่นคือโปรเซสเซอร์ Xeon Scalable 8380 2P”Ice Lake”

การยกระดับรุ่นจากมิลานไปยังเจนัวคือ น่าทึ่งในเซิร์ฟเวอร์ที่หลากหลายและการวัดประสิทธิภาพ HPC ที่ฉันเคยทำ ตอนนี้ฉันถูกทิ้งให้ฝันกลางวันว่า Genoa-X จะหน้าตาเป็นอย่างไรในปีหน้า เพราะรู้ว่ายังมีศักยภาพที่จะบีบ Zen 4 ออกทางฝั่งเซิร์ฟเวอร์ได้มากขึ้น เช่นเดียวกับ CPU ของ Bergamo ในปีหน้าถึง 128 คอร์สำหรับเน้นที่คลาวด์ ปริมาณงานในการประมวลผล

ดังที่ฉันได้แสดงไว้มากมายแล้วในฝั่งเดสก์ท็อป Ryzen 7000 ซีรีส์ การใช้งาน AVX-512 ของ AMD Zen 4 นั้นมีประสิทธิภาพอย่างน่าทึ่งและเป็นจริงมากขึ้นในฝั่งเซิร์ฟเวอร์ ด้วยภาระงานที่เกี่ยวข้องมากขึ้นที่นี่ ซึ่งสามารถใช้ AVX-512 และยกระดับที่น่าทึ่งดังที่แสดงในการวัดประสิทธิภาพเหล่านี้

ตามราคา CPU ซีรีส์ EPYC 9004 สามารถแข่งขันกับ EPYC 7003″ที่มีอยู่เดิม”โปรเซสเซอร์ Milan(X)”และโปรเซสเซอร์ Xeon Scalable Ice Lake อย่างไรก็ตาม การเปลี่ยนไปใช้ Genoa นั้นหมายความว่าต้องการหน่วยความจำระบบ DDR5 ECC ที่แพงกว่า DDR4 ด้วย ฉันยังไม่ได้รับข้อมูลการกำหนดราคาขั้นสูงใดๆ บนเมนบอร์ดขายปลีก EPYC Genoa ใดๆ ดังนั้นฉันจึงไม่แน่ใจว่าข้อมูลดังกล่าวจะออกมาเป็นอย่างไร แต่น่าจะมาจาก Socket SP5 ที่ซับซ้อนกว่าและความต้องการด้านพลังงานที่สูงขึ้น เห็นได้จากมาเธอร์บอร์ด EPYC SP3 โปรเซสเซอร์ EPYC Milan จะยังคงใช้งานได้สำหรับผู้ที่มองหาเซิร์ฟเวอร์ที่มีราคาต่ำกว่า แต่ยังคงประสิทธิภาพที่ดีอยู่

ในฝั่งสนับสนุนของ Linux เคอร์เนลต้นทางของ Linux และคีย์อื่นๆ ส่วนประกอบอยู่ในเกณฑ์ดีสำหรับการสนับสนุนเมื่อเปิดตัวด้วย EPYC 9004 ซีรีส์… จริงอยู่ ซึ่งค่อนข้างจะได้รับจากส่วนแบ่งตลาดเซิร์ฟเวอร์ Linux ในปัจจุบัน แต่ยังคงมีที่ว่างสำหรับ AMD ที่จะก้าวไปข้างหน้าในการสนับสนุน Linux/โอเพ่นซอร์ส ตัวอย่างเช่น AMD ล่าช้าด้วยแพทช์ IBRS อัตโนมัติสำหรับเคอร์เนล Linux ในการโพสต์เมื่อสัปดาห์ที่แล้วเท่านั้น นอกจากนี้ยังมีเฉพาะกับ Linux 6.1 เท่านั้นซึ่ง AMD CPU cache-to-cache และการรายงานหน่วยความจำด้วย perf นั้นเชื่อมโยงไปถึงสำหรับผู้ที่สนใจในความสามารถในการสร้างโปรไฟล์แบบขยายเหล่านั้น นอกจากนี้ การเปิดตัวครั้งแรกด้วย Linux 6.1 เท่านั้นคือฟังก์ชัน LbrExtV2 Last Branch Record ซึ่งเป็นฟังก์ชันใหม่สำหรับ Zen 4 ในขณะเดียวกัน Linux 6.0 ได้ขยาย AMD X2AVIC สำหรับเครื่องเสมือน KVM ออกไป ยังคงไม่ได้รับการ mainlines ในเคอร์เนล Linux แต่มีอยู่ในรูปแบบแพตช์คือการสนับสนุน QoS เกี่ยวกับการจัดสรรแบนด์วิดท์หน่วยความจำช้าด้วยหน่วยความจำ CXL และการกำหนดค่าเหตุการณ์การตรวจสอบแบนด์วิดท์ (BMEC) ดังนั้นจึงมีคุณลักษณะที่ไม่สำคัญบางประการที่ได้เห็นการมาถึงล่าช้าสำหรับเคอร์เนล mainline ของลีนุกซ์ แต่อย่างน้อยในแง่ของการสนับสนุนคีย์ทั้งหมดก็อยู่ในสภาพที่ดีสำหรับการเปิดตัว แน่นอนว่าเมื่อคุณสมบัติมาถึง mainline ก็มีเวลาเพิ่มขึ้นก่อนที่จะค้นหาเคอร์เนลเหล่านี้ที่ใช้งานโดยลีนุกซ์รุ่นต่างๆ หรือแบ็คพอร์ตไปยังเวอร์ชันเคอร์เนลขององค์กรสำหรับไลค์ของ RHEL และ SLES ในแง่บวก เทรนด์ไลน์อัพสตรีม Linux ของ AMD สำหรับช่วงเวลาก่อนการเปิดตัวได้รับการปรับปรุงสำหรับโปรเซสเซอร์ EPYC/Zen รุ่นต่อๆ ไป (ส่วนใหญ่เนื่องจากมีการว่าจ้างวิศวกร Linux จำนวนมากขึ้นในช่วงสองปีที่ผ่านมา)

ยังคงมีมุมที่โชคร้ายของการสนับสนุนการปรับแต่งคอมไพเลอร์ที่ล่าช้าสำหรับโปรเซสเซอร์รุ่นใหม่นี้ เฉพาะช่วงกลางเดือนตุลาคมที่ AMD ส่งคอมไพเลอร์ Znver4 รองรับ GCC ที่เพิ่มเป้าหมาย”-march=znver4″และรวมเข้ากับ GCC 13 Git ในปลายเดือนตุลาคม แต่ด้วยการสนับสนุนเบื้องต้นนี้ มันทำให้ตารางต้นทุน/การปรับแต่งจาก Znver3-การปรับจูน Znver4 นั้นคาดว่าจะ”ภายหลัง”หวังว่าการสนับสนุนที่ได้รับการปรับแต่งจะยังคงทันเวลาสำหรับ GCC 13 ซึ่งจะเห็นการเปิดตัวที่เสถียรในชื่อ GCC 13.1 ประมาณเดือนมีนาคมถึงเมษายนปีหน้า แต่มันจะไม่เป็นเช่นนั้นจนกว่าการแจกจ่าย Linux H2’2023 ส่วนใหญ่จะเผยแพร่เช่น Ubuntu 23.10 ซึ่ง GCC 13 ใช้เป็นคอมไพเลอร์ระบบเริ่มต้น หาก AMD ได้รับการสนับสนุน Znver4 ใน GCC ล่วงหน้าก่อนการเปิดตัว (เช่นที่ Intel เป็นที่รู้จักและได้ขยายขีดความสามารถของ Sapphire Rapids และ AMX สำหรับ GCC 12 ออกไป) ก็สามารถจัดส่งได้ใน Ubuntu 22.04 LTS และการกระจายล่าสุดอื่น ๆ นอกจากนี้ยังมีโปรแกรมแก้ไข Znver4 สำหรับ GNU Binutils ที่อยู่ในรายชื่อผู้รับจดหมายและในขณะที่เขียนบทความนี้ยังไม่ได้รวมเข้าด้วยกัน

หรือกล่าวอีกนัยหนึ่งในการเปิดตัวคอมไพเลอร์ GCC 13 ประจำปีที่ AMD อยู่ เพียงเปิดตัวการรองรับ Zen 4 ของพวกเขา Intel ได้ทำงานและรวมเข้าด้วยกันเพื่อรองรับ GCC 13 สำหรับโปรเซสเซอร์ 2023 ~ 2024 ต่างๆ GCC 13 ได้จัดคิว Grand Ridge และ Granite Rapids, Meteor Lake, Sierra Forest แล้ว ซึ่งรวมถึงการเปิดใช้งานคำสั่งใหม่ๆ ที่มาพร้อมกับโปรเซสเซอร์เหล่านั้น เป็นการสนับสนุนที่ทันท่วงทีที่ฉันอยากเห็นจาก AMD (และเมื่อหลายปีก่อนพวกเขาตรงต่อเวลาด้วยการสนับสนุน GCC ในช่วงต้น) ดังนั้นเมื่อถึงเวลาที่โปรเซสเซอร์เหล่านี้ถูกจัดส่ง การรองรับ Znver4 ก็ควรได้รับการเผยแพร่แล้ว คอมไพเลอร์ที่เสถียรซึ่งพบโดยลีนุกซ์ดิสทริบิวชันล่าสุด ในขณะที่เขียน ยังไม่มีแพตช์ Znver4 ใด ๆ ที่โพสต์สำหรับการตรวจสอบอัปสตรีมในด้าน LLVM/Clang ในขณะที่มีจังหวะการปล่อยอย่างน้อยหกเดือน Intel ยังคงเป็นผู้นำในด้านซอฟต์แวร์ในแง่ของเวลาโอเพ่นซอร์ส/ลินุกซ์ที่เป็นตัวเอกในกรณีส่วนใหญ่ในช่วงหลายปีที่ผ่านมา ช่วงเวลาการเปิดใช้งานต้นน้ำเป็นสิ่งที่น่ารำคาญที่ฉันมีกับ AMD ในแต่ละรอบการเปิดตัว ทางด้านคอมไพเลอร์ เหตุผลเชิงตรรกะเดียวที่ฉันมีคือพวกเขาต้องการเล่นการ์ดใกล้กับเสื้อกั๊กและไม่เปิดเผยแผนการขยาย ISA ใหม่สำหรับซีพียูในอนาคตเร็วเกินไป

ได้รับ เว้นแต่ว่าคุณกำลังรวบรวมการเพิ่มประสิทธิภาพ รหัสสำหรับเป้าหมาย CPU ของเซิร์ฟเวอร์ การสนับสนุนคอมไพเลอร์ Znver4 นี้ไม่ใช่ปัญหา (หรืออะไร) มากสำหรับคุณ แต่เมื่อพิจารณาถึงความน่าสนใจที่เพิ่มขึ้นของ AMD ในด้านการประมวลผลประสิทธิภาพสูง (HPC) น่าแปลกใจเล็กน้อยที่พวกเขาไม่ได้สนับสนุนคอมไพเลอร์นี้มาก่อน อย่างน้อยควรมี AMD Optimizing C/C++ Compiler (AOCC) รุ่นใหม่ในเร็วๆ นี้ ซึ่ง Zen 4 จะอยู่ในสภาพที่ดี เมื่อ AOCC ใหม่ออกแล้ว ฉันจะใช้คอมไพเลอร์เบนช์มาร์กบนเจนัวอย่างแน่นอน เพื่อดูผลกระทบของการรองรับคอมไพเลอร์ที่ปรับแต่งแล้วบนโปรเซสเซอร์เซิร์ฟเวอร์ Zen 4 เหล่านี้

นอกเหนือจากประสิทธิภาพที่ยอดเยี่ยมและการสนับสนุน Linux สำหรับการเปิดตัว อีกแง่มุมที่น่าตื่นเต้นของ EPYC รุ่นที่ 4 จากฝั่งแพลตฟอร์มอ้างอิงคือ Titanite ที่ทำงานด้วย OpenBMC! เป็นเรื่องที่น่าตื่นเต้นที่ได้เห็น OpenBMC แบบโอเพ่นซอร์สบน Linux ถูกใช้เป็นชุดซอฟต์แวร์สำหรับ BMC อ้างอิง และหวังว่าสิ่งนี้จะช่วยให้เห็น OpenBMC ถูกใช้โดยเซิร์ฟเวอร์ EPYC 9004 ซีรีส์เพิ่มเติม เช่นเดียวกัน หวังว่าอุตสาหกรรม/ลูกค้าที่สนใจในเฟิร์มแวร์โอเพนซอร์สจะดำเนินต่อไป และ AMD ก็สามารถมีส่วนร่วมกับ Coreboot และองค์ประกอบเฟิร์มแวร์โอเพนซอร์สอื่นๆ ได้มากขึ้น

Intel Sapphire Rapids สามารถทำงานร่วมกับ EPYC รุ่นที่ 4 ได้ดีเพียงใด จะเป็นการต่อสู้ที่น่าสนใจ แซฟไฟร์ Rapids จะเพิ่มได้ถึง 60 คอร์เท่านั้นเมื่อเทียบกับ 96 คอร์ในเจนัว แต่ข้อได้เปรียบของ Intel คือ Advanced Matrix Extensions (AMX), AVX-512 FP16 และบล็อกการเร่งความเร็วใหม่ต่างๆ สำหรับซอฟต์แวร์ที่สามารถใช้ประโยชน์จาก AMX และ Accelerator IP ของ Intel ได้ อย่างน้อยก็อาจเป็นการแข่งขันที่น่าสนใจมากสำหรับ Genoa แต่สำหรับปริมาณงานเซิร์ฟเวอร์แบบเดิม ๆ จะนำเสนอความท้าทายที่ค่อนข้างสำคัญ–ฉันต้องการเตือนคุณว่าค่าเฉลี่ยทางภูมิศาสตร์ของ EPYC 9654 2P คือ 2 เท่า ของ Xeon Platinum 8380 2P นอกจากนี้ยังน่าสนใจที่จะเห็นว่า Intel แข่งขันกับซีรีส์ EPYC 9004 ในด้านราคาโดยเฉพาะอย่างยิ่งกับ Sapphire Rapids ที่แนะนำ Intel On Demand/Software Defined Silicon ซึ่งจะทำให้ฉากราคามีความซับซ้อนมากขึ้นโดยเฉพาะอย่างยิ่งหากเชื่อมโยงกับบล็อกตัวเร่งความเร็วใหม่ที่มีความสำคัญยิ่งสำหรับการส่งมอบประสิทธิภาพการแข่งขัน. สิ่งหนึ่งที่น่าสนใจสำหรับ Intel กับ Sapphire Rapids คือ HBM2e SKU ของพวกเขาที่ตอนนี้รู้จักกันในชื่อ Xeon Max ในขณะที่ปีหน้า AMD จะมี Genoa-X ที่จะประกาศ ประโยชน์อื่นๆ ของโปรเซสเซอร์ AMD 4th Gen EPYC ซีรีส์ ได้แก่ การรองรับ CXL 1.1+ และการสนับสนุน SEV-SNP ที่ขยายเพิ่มด้วยความสามารถในการเข้ารหัสหน่วยความจำที่เพิ่มขึ้นและ VM อื่นๆ