เป็นส่วนหนึ่งของ ความพยายามที่จะอัปเดตการจัดการ”-mtune”ของ LLVM Clang เพื่อรองรับโปรเซสเซอร์รุ่นใหม่ โปรเซสเซอร์ AMD Zen ที่มี LLVM/Clang 15 ในปลายปีนี้ จะสามารถเพลิดเพลินกับการคำนวณรากที่สองได้เร็วและแม่นยำยิ่งขึ้นด้วยการปรับให้ใช้คำสั่ง SQRTSS/SQRTPS
รวมวันนี้เป็น mainline สำหรับ LLVM/Clang 15 (เพื่อไม่ให้สับสนกับ LLVM/แบบแยกสาขา Clang 14 ที่จะวางจำหน่ายในเดือนหน้า) เป็น SQRTSS ที่รวดเร็ว (Compute Square Root of Scalar Single-Precision Value)/SQRTPS (Square Root of Single-Precision Floating-Point Values) สำหรับคอร์โปรเซสเซอร์ AMD Zen ด้วย Zen 1 และใหม่กว่า คำแนะนำเหล่านั้นจะเร็วพอและคุ้มค่ากว่าเส้นทางรหัสที่มีอยู่ในขณะที่ยังมีความแม่นยำมากกว่า
แม้ว่าการเปลี่ยนแปลงการปรับจูน LLVM นี้จะส่งผลต่อซีพียู Zen ทั้งหมดที่จะกลับไปเป็น Zen 1 แต่การเปลี่ยนแปลง LLVM จะเกิดขึ้นในปี 2022 เท่านั้น
การปรับจูนคำสั่งสแควร์รูทสำหรับ AMD Zen ได้ถือเป็นส่วนหนึ่งของ อภิปรายในวงกว้างสำหรับการปรับปรุงพฤติกรรม-mtune generuc สำหรับ CPU ที่ทันสมัยกว่า คล้ายกับ-mtune เริ่มต้นของ GCC ที่ใช้กับ Haswell ดังที่ระบุไว้ในการสนทนานั้น”โมเดลกำหนดการ znver1/znver2 ปล่อยให้เป็นที่ต้องการอีกมาก”น่าเศร้าที่ไม่มีการปรับแต่งคอมไพเลอร์ AMD เชิงรุกโดย LLVM (และ GCC) เท่าที่มีอยู่ในด้าน Intel
Zen 1 นั้นเก่ากว่าครึ่งทศวรรษแล้ว ในขณะที่การเปลี่ยนแปลงสำหรับ LLVM/Clang 15 จะออกมาเสถียรในเดือนกันยายน 2022 น่าเศร้าที่การเปลี่ยนแปลงนี้เป็นเพียงตัวอย่างอีกตัวอย่างหนึ่งของการปรับแต่งซอฟต์แวร์ของ AMD ที่มาช้า (และบ่อยครั้ง เวลาที่เหลือขึ้นอยู่กับฝ่ายอิสระ/ชุมชนโอเพ่นซอร์ส) โดยเฉพาะอย่างยิ่งในด้านคอมไพเลอร์ในขณะที่โดยทั่วไปแล้ว Intel นั้นเร็วมากในการกำหนดเป้าหมายตระกูล CPU ใหม่ของพวกเขา และทำให้แน่ใจว่าพวกเขาได้รับการปรับให้เหมาะสมด้วยตารางต้นทุนที่แม่นยำ สามารถใช้คำสั่งใหม่ได้ ฯลฯ
การปรับ SQRTSS/SQRTPS สำหรับ Zen นี้เป็นครั้งแรกของ AMD กิจกรรมเฉพาะของ Zen สำหรับ LLVM จะย้อนกลับไปในเดือนกันยายนที่แล้ว หวังว่าเราจะเห็นการปรับแต่งคอมไพเลอร์โอเพ่นซอร์สของ AMD มากขึ้นในปีนี้-เรายังไม่เห็น znver4 ที่เปิดตัวในขณะที่ Intel เริ่มการแพตช์เวิร์คคอมไพเลอร์ Alder Lake และ Sapphire Rapids ในช่วงกลางปี 2020