Geekbench 6 เป็นเกณฑ์มาตรฐานล่าสุดในซีรีส์นี้

ข้อกล่าวหาที่ Apple จ่ายเงินให้กับนักพัฒนาเกณฑ์มาตรฐานเพื่อให้ iPhone สามารถเอาชนะรุ่นล่าสุดของ Samsung นั้นไม่มีมูลความจริง และอิงกับลัทธิชนเผ่า นี่คือเหตุผล

การร้องเรียนทางโซเชียลมีเดียเกี่ยวกับ S23 Ultra ของ Samsung ทำได้แย่กว่า iPhone หลังจากเปิดตัว Geekbench 6 ได้นำไปสู่การกล่าวหาว่ามีอคติเข้าข้าง Apple ในความเป็นจริง เป็นเพียงปัญหาในการรับรู้เกณฑ์มาตรฐานว่าเป็นมูลค่าทั้งหมดของสมาร์ทโฟน

ตั้งแต่เปิดตัว Geekbench 6 ในเดือนกุมภาพันธ์ แฟน ๆ ของ Samsung และ Android ต่างพากันไปที่ Twitter และฟอรัมสาธารณะอื่น ๆ เพื่อบ่นเกี่ยวกับผลลัพธ์ของมัน โดยเฉพาะอย่างยิ่งเนื้ออินเทอร์เน็ตนั้นเกี่ยวกับคะแนนของ Galaxy S23 Ultra ของ Samsung เมื่อเทียบกับกลุ่มผลิตภัณฑ์ iPhone 14 Pro

ภายใต้ Geekbench 5 Galaxy S23 Ultra จะได้รับประมาณ 1,600 คะแนนสำหรับ single-core และ 5,000 สำหรับ multi-core ใน ballpark ของ iPhone 14 Pro ที่ 1,900 และ 5,500 คะแนน

ตัวเลข Ballpark สำหรับผลลัพธ์ภายใต้ Geekbench 5

เมื่อทดสอบโดยใช้ Geekbench 6 Galaxy S23 Ultra จะจัดการได้ประมาณ 1,900 สำหรับการทดสอบแบบคอร์เดียว และ 5,100 สำหรับมัลติคอร์ ในขณะเดียวกัน iPhone 14 Pro จัดการ 2,500 สำหรับผลลัพธ์แบบคอร์เดี่ยวและ 6,500 สำหรับมัลติคอร์

สังเกตความแตกต่างของคะแนนที่มากขึ้น สำหรับผลการทดสอบสนามบอล Geekbench 6

ผลก็คือ iPhone ดีกว่า 18% ใน single-core และ 10% ใน multi-core ดีกว่า Samsung ภายใต้ Geekbench 5 เมื่อเปลี่ยนมาใช้ Geekbench 6 ผู้นำเพิ่มขึ้นเป็น 31% และ 18% ตามลำดับ

Samsung Galaxy S23 Ultra

ผู้ที่อาศัยอยู่ในโซเชียลมีเดียอ้างว่าการเปลี่ยนแปลงคะแนนนี้ต้องหมายความว่ามีอคติต่อ Apple แน่นอนว่าการแข่งขันที่ใกล้เคียงกันพอสมควรใน Geekbench 5 ควรจะใกล้เคียงกันใน Geekbench 6 ทวีตโต้แย้ง

ดังนั้น สำหรับคนเหล่านี้ จึงมีอคติในระดับหนึ่งที่สนับสนุน Apple เกือบทุกครั้งที่มีคนกล่าวหาว่า Apple จ่าย GeekBench ออกไปเพื่อให้ผลลัพธ์ดีขึ้น

เกมเปลี่ยนไปแล้ว

สิ่งแรกที่ต้องพิจารณาคือสิ่งที่นำไปสู่เกณฑ์มาตรฐาน เกณฑ์มาตรฐานแบบสังเคราะห์ทำการทดสอบที่หลากหลาย โดยรวบรวมผลลัพธ์เป็นคะแนนสุดท้ายที่เป็นเอกพจน์

การทดสอบเหล่านี้ไม่มีการเปลี่ยนแปลงตลอดอายุของการสร้างเกณฑ์มาตรฐาน ดังนั้นจึงมีระดับความสม่ำเสมอในการทดสอบระหว่างอุปกรณ์ต่างๆ ในระยะเวลาที่ยาวนาน

อย่างไรก็ตาม เครื่องมือเปรียบเทียบจำเป็นต้องอัปเดตทุก ๆ ครั้งเพื่อให้ตรงกับแนวโน้มในข้อกำหนดฮาร์ดแวร์ และประเภทของงานที่ผู้ใช้สามารถคาดหวังว่าจะดำเนินการกับอุปกรณ์ของตน

การเปิดตัว Geekbench 6 ทำสิ่งนี้ได้อย่างแม่นยำด้วยการปรับเปลี่ยนการทดสอบที่มีอยู่และการแนะนำการทดสอบใหม่เพื่อให้ตรงกับสิ่งที่เป็นไปได้ในอุปกรณ์สมัยใหม่ ซึ่งรวมถึงการทดสอบใหม่ที่มุ่งเน้นไปที่การเรียนรู้ของเครื่องและความเป็นจริงเสริม ซึ่งเป็นส่วนที่เติบโตอย่างมากในด้านคอมพิวเตอร์

“การทดสอบเหล่านี้จัดทำขึ้นอย่างแม่นยำเพื่อให้แน่ใจว่าผลลัพธ์แสดงถึงกรณีการใช้งานจริงและปริมาณงาน”คำอธิบายสำหรับ Geekbench 6 อ่าน

เครื่องจักร การเรียนรู้เป็นพื้นที่สำหรับการเติบโตและสามารถสร้าง”ศิลปะ”ได้ ดังนั้นการเปลี่ยนจุดสนใจของเกณฑ์มาตรฐานไปในทิศทางนั้นจึงสมเหตุสมผล

ให้คิดว่าเป็นการแข่งขันระหว่างนักวิ่งแข่งกับใครบางคนในปาร์กัวร์ โดยปกติแล้วการแข่งขันอาจเหมือนกับการวิ่ง 100 เมตร ซึ่งนักวิ่งแข่งคุ้นเคยกันดี แต่การเปลี่ยนไปใช้เส้นทางอุปสรรคอย่าง Tough Mudder อาจจะจบลงด้วยผลลัพธ์ที่ต่างออกไป

หากคุณไม่นำสิ่งใดไปจากงานชิ้นนี้ นี่คือประเด็นหลัก หากคุณเปลี่ยนสิ่งที่กำลังทดสอบ แน่นอนว่าผลลัพธ์จะแตกต่างออกไป

ไม่ต่างอะไรกับการเปรียบเทียบผลลัพธ์ของ Geekbench 5 กับผลการวัดประสิทธิภาพอื่นๆ ห้องสวีท เนื่องจากมีการทดสอบที่แตกต่างกันและมีการถ่วงน้ำหนักแบบอื่นสำหรับคะแนนสุดท้าย คุณจะพบความแตกต่างของประสิทธิภาพระหว่างอุปกรณ์และเครื่องมือวัดประสิทธิภาพที่แตกต่างกัน

หากคุณคิดว่า Geekbench 6 เป็นเครื่องมือเปรียบเทียบประสิทธิภาพที่แตกต่างจาก Geekbench 5 อย่างสิ้นเชิง ความแตกต่างในด้านประสิทธิภาพสามารถเข้าใจได้อย่างสมเหตุสมผลมากขึ้น

ใช่ การเปลี่ยนแปลงน้ำหนักเพื่อให้บางพื้นที่มีความสำคัญต่อคะแนนมากกว่าส่วนอื่นอาจทำให้คะแนนเปลี่ยนแปลงได้ แต่ตราบใดที่ไม่ส่งผลกระทบต่อความสามารถในการเปรียบเทียบคะแนนโดยตรงกับแอปอื่น ๆ จากรุ่นเดียวกัน ก็ไม่เป็นปัญหา

ความต้องการความไว้วางใจ

เครื่องมือเปรียบเทียบอยู่ในตำแหน่งที่มีสิทธิพิเศษ เนื่องจากเป็นเครื่องมือที่อาศัยความไว้วางใจจากผู้ใช้ทั้งหมดเพื่อให้ได้รับความจริง ในผลลัพธ์ที่พวกเขาให้ นักพัฒนาซอฟต์แวร์กล่าวว่าชุดของการทดสอบที่ทราบจะดำเนินการโดยเครื่องมือ และจะดำเนินการด้วยวิธีใดวิธีหนึ่งทุกครั้ง

โดยทั่วไปแล้ว เครื่องมือวัดประสิทธิภาพจะเติบโตได้ดีบนความน่าเชื่อถือนี้ โดยที่ไม่มีความลำเอียงเฉพาะบริษัทใดๆ เลย ผลลัพธ์ที่ออกมาถือว่าถูกต้องตามกฎหมายและไม่มีการผิดกติกาแต่อย่างใด

ตามสมมุติฐานแล้ว นักพัฒนาเบนช์มาร์กได้รับข้อเสนอเงินก้อนโตเพื่อมอบผลลัพธ์ให้กับผู้ผลิตรายใดรายหนึ่ง ก็อาจเป็นไปได้ที่จะดำเนินการสำเร็จ ยกเว้นว่าความแตกต่างของผลลัพธ์เมื่อเทียบกับส่วนอื่นๆ ของอุตสาหกรรมการเปรียบเทียบอาจทำให้ผู้ใช้เกิดคำถามในผลลัพธ์ที่การทดสอบนำมา

สถานการณ์ดังกล่าวจะทำลายความน่าเชื่อถือในผลลัพธ์ของเครื่องมือเปรียบเทียบ เนื่องจากผลลัพธ์อื่นๆ จะถูกตั้งคำถาม

ดังนั้นผู้พัฒนาเกณฑ์มาตรฐานจึงจำเป็นต้องลดอคติใดๆ ในผลการทดสอบ เพื่อให้มีความแม่นยำมากที่สุดเท่าที่จะเป็นไปได้ เพื่อรักษาความน่าเชื่อถือและความเชื่อถือที่สร้างขึ้น

รอสักครู่หรือสองนาที

ความน่าเชื่อถือนั้นต้องใช้เวลาในการสร้าง ซึ่งอาจเป็นปัญหาสำหรับเครื่องมือวัดประสิทธิภาพในตอนเริ่มต้น

หลังจากใช้งานไปหนึ่งปี เครื่องมืออย่าง Geekbench สามารถสร้างชุดผลลัพธ์ที่ผู้ใช้สามารถอ้างอิงได้ เนื่องจากสื่อและผู้ที่ชื่นชอบใช้ Geekbench 5 เป็นจำนวนมาก คอลเลคชันดังกล่าวจึงมีความสำคัญอย่างมาก

อย่างไรก็ตาม ตามที่เราได้พูดคุยกันแล้ว Geekbench 6 ไม่ใช่ Geekbench 5 และเพิ่งออกมาเพียงไม่กี่สัปดาห์เท่านั้น ยังไม่ได้สร้างแคตตาล็อกผลลัพธ์เพื่อให้สามารถเปรียบเทียบได้อย่างเพียงพอระหว่างอุปกรณ์ที่หลากหลาย

เมื่อเวลาผ่านไป Geekbench 6 จะ ติดตามขนาดแคตตาล็อกผลลัพธ์ของ Geekbench 5

น่าเสียดายที่ผู้คนจะพยายามเปรียบเทียบผลลัพธ์ของ Geekbench 6 กับ Geekbench 5 จนกว่าแค็ตตาล็อกนั้นจะมีความสมบูรณ์เพียงพอ

นี่เป็นปัญหาที่ไม่สามารถแก้ไขได้ทันที เนื่องจากต้องอาศัยผลลัพธ์ที่รวบรวมจากการทดสอบนับล้านครั้งโดยใช้เครื่องมือนี้ ซึ่งอาจใช้เวลาหลายเดือนกว่าจะเกิดขึ้นได้ ไม่ใช่สองสัปดาห์ที่ผ่านไปนับตั้งแต่เปิดตัว Geekbench 6

รอสัก 2-3 เดือน จากนั้นดูเกณฑ์มาตรฐาน หาก Geekbench 6 เชื่อถือได้ คุณจะเห็นแนวโน้มแบบเดียวกันในอุปกรณ์ทั้งหมดที่ทดสอบ

คำเตือนจากประวัติศาสตร์

ด้วยเกณฑ์มาตรฐานที่ถือเป็นวิธีหลักในการเปรียบเทียบอุปกรณ์หนึ่งกับอีกอุปกรณ์หนึ่ง ซึ่งอาจทำให้บางคนคิดว่านี่คือตัวตัดสินขั้นสุดท้ายของ สมาร์ทโฟนที่ดีที่สุดที่คุณสามารถซื้อได้คืออะไร

ตามที่เราเพิ่งอธิบายไป เกณฑ์มาตรฐานควรเป็นเพียงส่วนเล็กๆ ของการตัดสินใจซื้อโดยรวมของคุณ ไม่ใช่ทั้งหมด การจัดลำดับความสำคัญของเกณฑ์มาตรฐานเป็น”สิ่งที่สำคัญที่สุด”ได้นำไปสู่สถานการณ์ที่แปลกประหลาดในอดีต

ดูตัวอย่างรายงานจากเดือนมีนาคม 2022 เมื่อ Samsung ถูกจับได้ว่าปรับวิธีการทำงานของอุปกรณ์โดยเฉพาะโดยคำนึงถึงเกณฑ์มาตรฐาน

กลุ่มผลิตภัณฑ์ Galaxy S21 ของ Samsung ตกเป็นข่าวอื้อฉาวเกี่ยวกับการวัดประสิทธิภาพ

เพื่อให้สมาร์ทโฟนทำงานได้อย่างเย็นและไม่มีปัญหา ผู้ผลิตสมาร์ทโฟนสามารถเลือกจำกัดความสามารถในการประมวลผลของอุปกรณ์ของตนได้ สิ่งนี้สมเหตุสมผลสำหรับประเด็นที่ว่าสมาร์ทโฟนที่ร้อนแรงไม่เป็นที่ต้องการของผู้บริโภคและไม่สามารถระบายแบตเตอรี่ได้

ในตอนนั้น Samsung ถูกจับได้ว่ารายการแอปจำนวนมากมี”ขีดจำกัดประสิทธิภาพ”กล่าวคือการควบคุมปริมาณแอปด้วยเหตุผลดังกล่าว ยกเว้นว่าแอปเกณฑ์มาตรฐานเช่น Geekbench 5 และ Antutu ไม่ถูกควบคุมปริมาณเลย และทำงานได้ไม่จำกัด

สำหรับผู้ใช้ปลายทาง นี่หมายความว่าอุปกรณ์จะมีเกณฑ์มาตรฐานที่ดี แต่ในการใช้งานจริง อุปกรณ์จะทำงานในระดับประสิทธิภาพที่ต่ำกว่าที่คาดไว้สำหรับแอปทั่วไปจำนวนมาก

สิ่งนี้ทำให้ผู้ใช้ปลายทางสั้นลงอย่างมีประสิทธิภาพโดยทำให้พวกเขาเชื่อว่าอุปกรณ์ทำงานได้เร็วกว่าความเป็นจริง อย่างน้อยก็ต่ำกว่าเกณฑ์มาตรฐาน

การวัดประสิทธิภาพไม่ใช่โลกแห่งความจริง

จุดรวมของเกณฑ์มาตรฐานคือการให้วิธีการที่เป็นมาตรฐานในการเปรียบเทียบอุปกรณ์หนึ่งกับอีกเครื่องหนึ่ง และเพื่อ โดยทั่วไปทราบความแตกต่างในประสิทธิภาพ กุญแจสำคัญคือการสร้างมาตรฐาน และเช่นเดียวกับหลายๆ ด้านของชีวิต นั่นไม่จำเป็นต้องนำไปสู่การสะท้อนความสามารถของบางสิ่งอย่างแท้จริง

ความเชี่ยวชาญนี้ลงลึกไปถึงเกณฑ์มาตรฐานเฉพาะด้วย ในขณะที่ Geekbench เป็นแบบทั่วไปมากกว่า แต่ก็มีอย่างอื่นที่คำนึงถึงผู้ชมเฉพาะกลุ่ม

ตัวอย่างเช่น เกมเมอร์หลายคนใช้เกณฑ์มาตรฐานในเกม เช่น ในเกม Rise of the Tomb Raider สิ่งนี้สมเหตุสมผลในฐานะเกณฑ์มาตรฐาน เนื่องจากเป็นเกมจริง จึงสามารถทดสอบเฉพาะองค์ประกอบของประสิทธิภาพของอุปกรณ์โดยคำนึงถึงความต้องการของเกมเมอร์ได้ดีกว่า

ในขณะเดียวกัน แม้ว่า Cinebench เสนอการทดสอบที่เน้นไปที่ GPU แต่ส่วนใหญ่มีประโยชน์มากกว่าสำหรับผู้ที่ทำงานในการเรนเดอร์ 3 มิติ เนื่องจากเหมาะสำหรับงานด้านนั้นมากกว่าความต้องการ 3 มิติทั่วไป

นอกจากนี้ยังมีเกณฑ์มาตรฐานตามเบราว์เซอร์ แต่แม้ว่าจะมีประโยชน์สำหรับผู้ที่ทำงานด้านออนไลน์เป็นหลัก แต่จะไม่มีประโยชน์มากนักสำหรับผู้ที่ทำงานในรูปแบบ 3 มิติหรือเป็นเกมเมอร์ตัวยง

ตามหลักการแล้ว ผู้ใช้จำเป็นต้องเลือกเครื่องมือเปรียบเทียบที่ตรงกับความต้องการของตน Geekbench เป็นชุดการทดสอบที่เรียบง่ายและเป็นมาตรฐานทั่วไป แต่แม้ว่าจะไม่ได้ดีที่สุดสำหรับสถานการณ์เฉพาะ แต่ความง่ายในการใช้งานและวัตถุประสงค์ทั่วไปทำให้เหมาะสำหรับการทดสอบในตลาดมวลชน เช่น ในสิ่งพิมพ์

ถึงกระนั้น ไม่ว่าคุณจะใช้เกณฑ์มาตรฐานใด คุณจะไม่ได้รับข้อมูลสรุปทั้งหมดสำหรับความต้องการเฉพาะของคุณ คุณจะยังคงได้รับการบ่งชี้ แต่ไม่มีความแน่นอน

นักวิ่งแข่งคนนั้นเก่งในการแข่งขันระยะทางสั้นๆ แต่พวกเขาอาจจะไม่เก่งเรื่องภาษีหรือรู้ว่าไข่อยู่ที่ไหนในซุปเปอร์มาร์เก็ต การรู้ว่าพวกเขาจัดการแข่งขันอย่างไรไม่ได้ช่วยให้บัญชีของคุณเสร็จเร็วขึ้น แต่อย่างน้อยคุณก็จะรู้ว่าพวกเขาฟิตร่างกาย

ในทำนองเดียวกัน สมาร์ทโฟนสามารถทำงานบางอย่างได้สำเร็จตามเกณฑ์มาตรฐาน แต่ก็ยังเป็นค่าประมาณของสิ่งที่คุณต้องการทำกับอุปกรณ์ ตัวอย่างเช่น คุณอาจจัดลำดับความสำคัญของเวลาที่ใช้ในการปลดล็อกด้วยไบโอเมตริกซ์ หรือคุณภาพของภาพถ่ายของกล้อง

เครื่องมือเปรียบเทียบจะให้คำแนะนำทั่วไปเกี่ยวกับการเปรียบเทียบสมาร์ทโฟนกับอีกเครื่องหนึ่งภายใต้เงื่อนไขเฉพาะเท่านั้น ไม่ได้บอกว่ามันจะเข้ากับชีวิตคุณแค่ไหน

Categories: IT Info