Geekbench 6 est la dernière référence de la série.
Les accusations selon lesquelles Apple aurait payé des développeurs de référence pour que son iPhone puisse battre les derniers modèles de Samsung sont infondées et basées sur le tribalisme. Voici pourquoi.
Les plaintes des médias sociaux concernant le S23 Ultra de Samsung font pire que le iPhone après l’introduction de Geekbench 6 a conduit à des accusations de parti pris en faveur d’Apple. En réalité, c’est juste un problème dans la façon dont les repères sont perçus comme l’alpha et l’oméga de la valeur d’un smartphone.
Depuis l’introduction de Geekbench 6 en février, les fans de Samsung et d’Android se sont tournés vers Twitter et d’autres forums publics pour se plaindre de ses résultats. Plus précisément, le bœuf sur Internet concerne les scores du Galaxy S23 Ultra de Samsung par rapport à la gamme iPhone 14 Pro.
Sous Geekbench 5, le Galaxy S23 Ultra obtiendrait environ 1 600 pour le score monocœur et 5 000 pour le multicœur, dans la fourchette des scores 1 900 et 5 500 de l’iPhone 14 Pro.
Chiffres approximatifs pour les résultats sous Geekbench 5
Lorsqu’il a été testé avec Geekbench 6, le Galaxy S23 Ultra gérerait environ 1 900 pour le test monocœur et 5 100 pour le multicœur. Pendant ce temps, l’iPhone 14 Pro gère 2 500 pour le résultat monocœur et 6 500 pour le multicœur.
Remarquez la plus grande différence dans les scores pour les résultats du Geekbench 6 ballpark.
En effet, l’iPhone est 18% meilleur en single-core et 10% meilleur en multi-core que le Samsung sous Geekbench 5. En passant à Geekbench 6, l’avance est passée à 31% et 18% respectivement.
Samsung Galaxy S23 Ultra
Les habitants des médias sociaux affirment que ce changement de score doit signifier qu’il y a une sorte de biais dans le jeu envers Apple. Certes, une course raisonnablement serrée dans Geekbench 5 devrait toujours être également proche dans Geekbench 6, affirment les tweets.
Par conséquent, pour ces personnes, il existe un certain degré de préjugé pro-Apple. Comme c’est presque toujours le cas, quelqu’un a déjà accusé Apple de payer GeekBench pour augmenter les résultats.
Le jeu a changé
La première chose à considérer est ce qui entre dans un benchmark lui-même. Un benchmark synthétique effectue une variété de tests, avec des résultats compilés dans un score final et singulier.
Ces tests ne changent pas tout au long de la vie de la génération de référence. Il existe donc un niveau de cohérence dans les tests entre les appareils sur une longue période.
Cependant, les outils de référence doivent être mis à jour de temps en temps pour correspondre aux tendances des spécifications matérielles et au type de tâches qu’un utilisateur peut s’attendre à entreprendre avec ses appareils.
La sortie de Geekbench 6 a fait précisément cela, avec des modifications des tests existants et l’introduction de nouveaux tests pour mieux correspondre à ce qui est possible avec un appareil moderne. Cela inclut de nouveaux tests axés sur l’apprentissage automatique et la réalité augmentée, qui sont des domaines de croissance considérables en informatique.
“Ces tests sont conçus avec précision pour garantir que les résultats représentent des cas d’utilisation et des charges de travail réels”, indique la description de Geekbench 6.
Machine l’apprentissage est un domaine de croissance et est capable de créer de l'”art”, il est donc logique de déplacer l’orientation d’un benchmark dans cette direction.
Considérez-le comme une course entre un sprinter et quelqu’un qui aime le parkour. La course peut normalement être quelque chose comme le 100 mètres, auquel le sprinter est habitué, mais passer à quelque chose comme un parcours d’obstacles Tough Mudder se terminera probablement par un résultat différent.
Si vous ne retenez rien d’autre de cet article, voici le point principal. Si vous modifiez ce qui est testé, bien sûr, les résultats seront différents.
Ce n’est pas différent que si vous deviez comparer les résultats de Geekbench 5 à ceux d’autres benchmarks suites. Puisqu’il existe différents tests et une pondération alternative de chacun dans les scores finaux, vous trouverez des différences de performances entre les appareils pour varier également entre les outils de référence.
Si vous pensez que Geekbench 6 est un outil d’analyse comparative complètement différent de Geekbench 5, les différences de performances peuvent être plus raisonnables à comprendre.
Oui, un changement de pondération pour rendre certains domaines plus importants pour un score que d’autres peut entraîner un changement des scores. Mais, tant que cela n’affecte pas la capacité de comparer directement un score avec d’autres de la même génération de l’application, ce n’est pas vraiment un problème.
Le besoin de confiance
Les outils de benchmark sont dans une position privilégiée, en ce sens qu’ils sont une entité qui repose entièrement sur la confiance des utilisateurs pour être véridique dans les résultats qu’ils fournissent. Les développeurs disent qu’un ensemble de tests connus seront effectués par l’outil, et qu’ils seront effectués d’une certaine manière, à chaque fois.
Dans l’ensemble, les outils de référence prospèrent sur cette crédibilité, qu’il n’y a pas de parti pris spécifique à l’entreprise en jeu. Les résultats qui sortent sont considérés comme légitimes et qu’il n’y a aucun jeu déloyal.
Si, hypothétiquement, un développeur de référence se voyait offrir un énorme sac d’argent pour jeter les résultats en faveur d’un fabricant, il serait possible d’accomplir. Sauf que la différence de résultat par rapport au reste de l’industrie du benchmarking va probablement et du coup amener les utilisateurs à remettre en question les résultats que ce test apporte.
Une telle situation brisera la confiance dans les résultats d’un outil de référence puisque d’autres résultats seront remis en question.
Les développeurs de benchmarks ont donc besoin de réduire tout biais dans les résultats des tests, afin qu’ils puissent être aussi précis que possible, pour conserver la crédibilité et la confiance qu’ils ont acquises.
Attendez une minute chaude, ou deux
Cette crédibilité prend du temps à se former, ce qui peut être un problème pour les outils de référence au début.
Après un an de fonctionnement, des outils comme Geekbench peuvent constituer une collection de résultats auxquels les utilisateurs peuvent se référer. Geekbench 5 étant si utilisé par les médias et les passionnés, cette collection est extrêmement importante.
Cependant, comme nous en avons discuté, Geekbench 6 n’est pas Geekbench 5, et il n’est sorti que depuis quelques semaines. Il n’a pas encore construit ce catalogue de résultats pour pouvoir permettre de manière adéquate des comparaisons entre un large éventail d’appareils.
Au fil du temps, Geekbench 6 rattraper la taille du catalogue de résultats de Geekbench 5.
Malheureusement, cela signifie que les gens essaieront de comparer les résultats de Geekbench 6 à Geekbench 5 jusqu’à ce que ce catalogue soit suffisamment étoffé pour avoir de l’importance.
Il s’agit d’un problème qui ne sera pas résolu immédiatement, car il repose sur les résultats recueillis à partir de millions de tests à l’aide de l’outil. Cela peut prendre des mois à exister, certainement pas les deux semaines qui se sont écoulées depuis la sortie de Geekbench 6 lui-même.
Attendez quelques mois, puis jetez un œil aux benchmarks. Si Geekbench 6 est digne de confiance, vous verrez le même type de tendances sur tous les appareils testés par celui-ci.
Un avertissement de l’histoire
Avec des repères considérés comme un moyen principal de comparer un appareil à un autre, cela peut amener certains à penser qu’il est l’arbitre ultime de quel est le meilleur smartphone que vous pouvez acheter.
Comme nous venons de le préciser, une référence ne devrait représenter qu’une petite partie de votre décision d’achat globale, et non l’intégralité de celle-ci. Cette priorisation des benchmarks comme « la chose la plus importante » a déjà conduit à des situations étranges dans le passé.
Prenez l’exemple des rapports de mars 2022, lorsque Samsung a été surpris en train d’ajuster le fonctionnement de ses appareils spécifiquement en tenant compte des références.
La gamme Galaxy S21 de Samsung a été prise dans un scandale d’étranglement impliquant des références.
Pour que les smartphones fonctionnent bien et sans problème, un fabricant de smartphones peut choisir de limiter la capacité de traitement de ses appareils. Cela a du sens jusqu’à un certain point, dans la mesure où un smartphone brûlant n’est pas souhaitable pour les consommateurs, ni celui qui peut vider la batterie.
À l’époque, Samsung a été surpris en train de soumettre une longue liste d’applications à des”limites de performances”, à savoir les étrangler pour une telle raison. Sauf que les applications de référence comme Geekbench 5 et Antutu n’ont pas du tout été limitées et ont fonctionné sans restriction.
Pour l’utilisateur final, cela signifierait que l’appareil se comparerait bien, mais qu’en utilisation réelle, il finirait par fonctionner à un niveau de performances bien inférieur à celui attendu pour de nombreuses applications normales.
Cela trompe effectivement l’utilisateur final en lui faisant croire que l’appareil fonctionne plus vite qu’en réalité, du moins selon les critères de référence.
Les benchmarks ne sont pas le monde réel
L’intérêt d’un benchmark est qu’il vous donne un moyen standardisé de comparer un appareil avec un autre, et de connaissent généralement la différence de performance. La clé est la standardisation, et comme dans de nombreux domaines de la vie, cela ne conduira pas nécessairement à un reflet fidèle des capacités de quelque chose.
Cette spécialisation va même jusqu’au benchmark spécifique lui-même, car si Geekbench est plus généralisé, il y en a d’autres avec des publics spécifiques à l’esprit.
Par exemple, de nombreux joueurs s’appuient sur des références en jeu telles que celle de Rise of the Tomb Raider. Cela a du sens en tant que référence, car il s’agit d’un jeu réel, il peut mieux tester uniquement les éléments de performance d’un appareil en tenant compte des besoins d’un joueur.
Pendant ce temps, bien que Cinebench propose des tests axés sur les GPU, il est largement plus utile pour ceux qui travaillent dans le rendu 3D, car il répond davantage à ce domaine plutôt qu’aux besoins 3D généraux.
Il existe également des benchmarks basés sur un navigateur, mais bien qu’utiles pour ceux qui travaillent dans des domaines centrés sur le Web, ils ne le seront pas pour ceux qui travaillent en 3D ou qui sont des joueurs passionnés.
Idéalement, les utilisateurs doivent choisir les outils de référence qui répondent à leurs besoins. Geekbench est une suite de tests simple et généralisée, mais bien qu’elle ne soit pas la meilleure pour des scénarios spécifiques, sa facilité d’utilisation et sa nature polyvalente la rendent idéale pour les tests de masse, comme dans les publications.
Même ainsi, quel que soit le benchmark que vous utilisez, vous n’obtiendrez pas un aperçu complet de vos besoins spécifiques. Vous aurez toujours une indication, mais pas de certitudes.
Ce sprinteur est excellent dans les courses de courte distance, mais il ne sera probablement pas aussi doué pour faire ses impôts ou pour savoir où se trouvent les œufs dans un supermarché. Savoir comment ils se classent dans une course ne vous aidera pas à faire votre comptabilité plus rapidement, mais vous saurez au moins qu’ils sont en bonne forme physique.
De même, un smartphone peut réussir à accomplir des tâches spécifiques dans un benchmark, mais cela reste une approximation de ce que vous voulez faire avec l’appareil. Par exemple, vous pouvez donner la priorité au temps nécessaire pour effectuer le déverrouillage biométrique ou à la qualité d’image de la caméra.
Un outil de référence ne donnera qu’un guide général sur la façon dont un smartphone est comparé à un autre dans des conditions spécifiques. Cela ne vous dira pas à quel point cela s’intégrera à votre vie.