L’EPYC 9654 est le nouveau processeur phare d’AMD avec 96 cœurs/192 Horloge de base de 2,4 GHz avec horloge boost de 3,7 GHz et dispose d’un TDP de 360 Watts. Le TDP configurable sur cette seule partie à 96 cœurs est de 320 à 400 Watts.
L’EPYC 9554 est quant à lui la partie supérieure à 64 cœurs d’AMD par rapport à l’EPYC 9534. L’EPYC 9554 arbore 64 cœurs/128 threads avec une horloge de base de 3,1 GHz et une horloge boost de 3,75 GHz tout en ayant un TDP de 360 Watt comme l’EPYC 9654. Comme l’EPYC 9654, le cTDP peut être ajusté de 320 à 400 Watts. Le processeur phare actuel de Milan, l’EPYC 7763, pour rappel est de 64 cœurs/128 threads avec une horloge de base à 2,45 GHz et une horloge de boost maximale à 3,5 GHz. Ou du côté Milan-X se trouve l’EPYC 7773X avec une horloge de base de 2,2 GHz et une horloge de boost maximale de 3,5 GHz tout en ayant les 768 Mo de cache L3.
L’AMD EPYC 9374F 32-la partie haute fréquence de base à venir dans son examen séparé a une horloge de base de 4,05 GHz et un boost de 4,3 GHz tout en ayant un TDP de 320 Watt.
L’EPYC 9654 a un prix de lancement d’environ 11 805 USD, l’EPYC 9554 coûtera environ 9 087 USD et l’EPYC 9374F environ 4 850 USD.
Une comparaison de taille entre l’AMD Milan SP3 et l’AMD Genoa SP5.
AMD a aimablement fourni la plate-forme de référence Titanite et les processeurs EPYC 9004 Genoa pour cette revue et le benchmarking Linux. Pour le lancement d’aujourd’hui, passez en revue les processeurs de serveur testés :
-EPYC 75F3
-EPYC 75F3 2P
-EPYC 7713
-EPYC 7713 2P
-EPYC 7763
-EPYC 7763 2P
-EPYC 7773X
-EPYC 7773X 2P
-EPYC 9554
-EPYC 9554 2P
-EPYC 9654
-EPYC 9654 2P
-Xeon Platinum 8362
-Xeon Platinum 8362 2P
-Xeon Platinum 8380
-Xeon Platinum 8380 2P
Tous ces processeurs ont été fraîchement testés/re-testés avec Ubuntu 22.10 avec le noyau Linux 6.0 et GCC 12. Plus de détails sur la pile logicielle ci-dessous.
Pour les nouveaux processeurs EPYC Genoa, j’ai testé les EPYC 9554 et 9654 à la fois en mode déterminisme”performance”par défaut ainsi qu’en le BIOS passant en mode de déterminisme”puissance”pour ceux qui sont curieux de connaître l’impact global sur les performances du contrôle du déterminisme du BIOS. Les résultats de Gênes avec le suffixe”-Puissance”correspondent à une exécution en mode déterminisme de puissance par rapport au déterminisme de performance par défaut. Tous les autres paramètres du BIOS pour chacun des processeurs Intel/AMD testés étaient à leurs valeurs par défaut respectives. Les tests 1P et 2P ont été effectués sur tous les processeurs testés disponibles.
Compte tenu de mon”point saillant”habituel et de mon orientation vers l’avenir, tous ces tests de performance ont été effectués d’Ubuntu 22.10 avec son compilateur de stock GCC 12.2. Pour un nouveau look du noyau, Linux 6.0 était utilisé. Cette même pile logicielle a été utilisée sur tous les serveurs/processeurs testés. Chacune des configurations fonctionnait avec la mémoire à sa vitesse nominale maximale et sa configuration de canal mémoire. Tous les processeurs ont été testés à l’aide du régulateur de mise à l’échelle de la fréquence du processeur”performance”.
Ubuntu 22.04 LTS est cependant en bon état pour EPYC Genoa également et j’ai effectué des tests de ces processeurs de la série EPYC 9004 sur Ubuntu 22.04 avec son noyau Linux 5.15, mais pour mon regard sur les performances Linux à l’avenir et souhaitant utiliser le tout dernier logiciel en amont, cette série d’analyses comparatives a été effectuée avec Ubuntu 22.10 + Linux 6.0 sur tous les processeurs de serveur testés.
Sans surprise, la prise en charge du processeur AMD EPYC 9004″Genoa”pour Linux est en bonne forme pour le lancement. L’utilisation d’une distribution avec une version récente du noyau Linux (ou une distribution Linux d’entreprise avec ses noyaux rétro-portés/correctifs) devrait être en bon état pour ces processeurs de serveur Zen 4. Certaines fonctionnalités n’ont été ajoutées que récemment, comme la gestion mise à jour de Last Branch Record, mais toutes les fonctionnalités clés sont déjà en place, y compris la surveillance de la température et de la consommation d’énergie. Côté compilateur, le support de Zen 4 (znver4) est en retard. AMD n’a publié que récemment son correctif d’activation Znver4 initial tout en conservant les tableaux de coûts de Znver3. Ce support initial se trouvera dans GCC 13 qui devrait sortir dans les premiers mois de l’année prochaine et le support LLVM/Clang 16.0 est en attente. AMD devrait publier prochainement une nouvelle version AOCC pour son compilateur AMD Optimizing C/C++ avec des optimisations Zen 4.
Au cours de l’analyse comparative, une large sélection d’analyses comparatives de serveur/HPC ont été effectuées tout en surveillant la puissance du processeur. consommation des interfaces RAPL exposées et fournissant des métriques de performances par watt par référence et plus encore.
Dès le départ, en lançant certaines références HPC, les processeurs AMD EPYC Genoa montrent leurs prouesses en matière de performances. L’AMD EPYC 9654 2P avait une durée d’exécution inférieure de 40 % pour le code GPAW DFT par rapport à l’EPYC 7773X Milan-X et approchait le point d’être presque deux fois plus rapide que les processeurs EPYC 7763. Lors du passage en mode déterminisme de puissance, les performances des processeurs EPYC Genoa étaient plus élevées. Ce ne sont tout simplement pas les 96 cœurs contre 64 cœurs qui ont conduit à la grande amélioration avec Genoa, car les performances de l’EPYC 9554 1P2P à 64 cœurs étaient également exceptionnelles : l’EPYC 9554 correspondait aux performances de l’EPYC 7763 2P pour GPAW !
Mais , bien sûr, ces nouveaux processeurs EPYC 9554/9654 consomment plus d’énergie que leurs prédécesseurs, comme on pouvait s’y attendre.
Sur la base des performances par dollar, les nouveaux processeurs EPYC 9554/9654 fonctionnent assez bien contre les pièces de la génération précédente. Bien sûr, ce n’est que le prix du processeur, mais il y a aussi le prix de la mémoire DDR5 et le prix de la plate-forme à prendre en compte, mais il n’a pas été possible de proposer des évaluations précises avant le lancement pour voir comment les prix de la carte mère Genoa, etc., se compareront à Milan(X).
Les performances des AMD EPYC 9654 et EPYC 9554 étaient tout aussi exceptionnelles avec la référence de dynamique moléculaire GROMACS. Les performances de l’EPYC 9654 2P étaient de 1,66 fois la vitesse de l’EPYC 7773X 2P et la configuration de l’EPYC 9654 1P correspondait presque aux performances de l’EPYC 7773X 2P… Il y a une augmentation substantielle grâce aux cœurs supplémentaires, à la mémoire système DDR5, aux 12 canaux de mémoire, à l’AVX-512, et d’autres améliorations architecturales Zen 4. Et en cas de fonctionnement en mode déterminisme de puissance, des performances encore plus élevées.
Alors que la consommation d’énergie de l’EPYC Genoa était plus élevée qu’avec l’EPYC Milan(X) et le Xeon Ice Lake, sur une base de performances par watt pour GROMACS, le l’efficacité se retrouve avec Gênes. Les processeurs phares d’Intel Xeon Platinum 8380 n’étaient tout simplement pas compétitifs par rapport à Genoa et ont eu assez de mal à se mesurer à Milan (X) dans la plupart des benchmarks, mais au moins Xeon Sapphire Rapids arrivera, espérons-le, au prochain trimestre.
La performance par-les métriques en dollars basées sur le prix du processeur mettent Gênes en bonne forme.
Les processeurs EPYC Genoa testés ont obtenu des performances incroyables avec NAMD et ont fourni des résultats formidables de génération en génération depuis Milan/Milan-X et ont élargi l’avance sur la génération actuelle Processeurs Xeon Ice Lake.
AMD EPYC Genoa a obtenu d’excellents résultats avec le benchmark Graph500.
Les résultats EPYC 9654/9554 étaient également stupéfiants pour le benchmark HPCG. En termes simples, la série AMD EPYC 9004, à travers une grande variété de tests de performances, offrait constamment une mise à niveau de performances sans précédent.
Les processeurs EPYC 9554 et EPYC 9654 ont présenté des performances phénoménales avec les prévisions météorologiques à l’aide de WRF. Le passage non seulement de l’EPYC 7773X/7763 à l’EPYC 9654 était stupéfiant, mais même l’EPYC 9554 à 64 cœurs présentait un énorme avantage grâce à l’AVX-512 et à d’autres améliorations par rapport aux processeurs de serveur Zen 3 précédents.
Sur sur la base des performances par dollar avec WRF, les processeurs EPYC Genoa ont continué à briller.
Avec RELION, l’amélioration générationnelle était moindre mais toujours significative de Milan(X) à Gênes.
AMG était l’une des rares références où les processeurs Xeon Platinum 8362/8380 Ice Lake pouvaient devancer les processeurs phares EPYC Milan, mais ce n’était plus le cas avec Genoa.
Tout en ayant une consommation d’énergie plus élevée, l’EPYC Les processeurs Genoa offraient une grande efficacité énergétique.
Sur un large éventail de références HPC, les performances du processeur EPYC Genoa ont tout simplement été phénoménales. Les dernières semaines d’exécution d’EPYC Genoa ont été parmi les résultats de référence de performance les plus convaincants que j’ai vus au cours des 18 dernières années avec l’incroyable élévation générationnelle tout en offrant une efficacité et une valeur énergétiques de premier plan.
À travers un large assortiment de benchmarks HPC, les configurations EPYC 9654 et 9554 offraient d’excellentes performances dans le mode de déterminisme des performances par défaut.”processeurs avec AVX-512. Les processeurs Xeon Platinum 8362/8380 ont fourni de meilleures performances par rapport aux processeurs Milan/Milan-X grâce à AVX-512, mais la mise en œuvre efficace de l’AVX-512 de Genoa a conduit à des performances bien supérieures maintenant avec OpenVINO.
L’amélioration avec OpenVINO pour Genoa est si spectaculaire que la valeur des performances par dollar est bien supérieure à celle des processeurs Intel/AMD existants.
OpenVINO était un bastion pour Intel Xeon Scalable”Ice Lake”sur Milan/Milan-X mais le processeur EPYC 9554″Genoa”peut même rivaliser avec deux processeurs Xeon Platinum 8380. Les performances de Genoa sont folles.
Sur les nombreux modèles différents testés, OpenVINO 2022 fonctionnait parfaitement avec les processeurs EPYC Genoa grâce au support AVX-512. Alors qu’au départ, j’étais préoccupé par l’implémentation AVX-512 de Zen 4 utilisant un chemin de données 256 bits, il s’est avéré très performant et sans les implications énergétiques/thermiques d’AVX-512 sur les processeurs Intel précédents.
Les processeurs EPYC Genoa fonctionnaient également très bien avec la bibliothèque de réseau neuronal profond oneDNN d’Intel qui est capable d’utiliser largement AVX-512.
Même pour un travail”simple”comme la compilation de code sur plusieurs tâches pour saturer le Processeurs, les performances de la série AMD EPYC 9004 offraient toujours des améliorations générationnelles considérables par rapport à Milan.
L’avantage du nombre de cœurs avec AMD EPYC aide également et est un domaine dans lequel EPYC Genoa sera toujours en tête par rapport aux prochains processeurs Sapphire Rapids d’Intel.
Les nouveaux processeurs Genoa haut de gamme peuvent compiler une version de noyau Linux x86_64 par défaut en moins de 20 secondes !
Ou la construction d’un noyau complet avec tous les modules de noyau disponibles peut être effectuée en moins de deux minutes.
Sur la base des performances par dollar, le résultat EPYC Genoa s étaient comparables au prix actuel de Milan pour la valeur si vous êtes intéressé par une ferme de compilation de code/serveur CI.
Pour les fermes de rendu basées sur CPU, AMD EPYC Genoa avec jusqu’à 96 cœurs et les améliorations de conception par rapport à Zen 3 portaient leurs fruits avec des améliorations significatives du temps de rendu. Avec la scène BMW bien connue, le processeur phare EPYC 9654 2P pouvait le rendre en seulement 8 secondes !
AMD EPYC Genoa fonctionnait très bien avec Blender 3.3 avec de grandes améliorations générationnelles et de bien meilleures performances que ce qui peut être réalisé avec Xeon Scalable Ice Lake et son nombre de cœurs beaucoup plus faible.
Le mode de déterminisme de puissance peut encore plus aider avec les temps de rendu de Blender, si l’augmentation de la puissance/de l’impact thermique ne vous dérange pas.
Sur la base des performances par dollar, les nouveaux processeurs Genoa sont très comparables en termes de prix à Milan sur une base CPU au moins.
Les noyaux de lancer de rayons Embree d’Intel peuvent bénéficier de manière significative de Gênes avec AVX-512. L’EPYC 9654 2P en mode déterminisme de puissance était deux fois plus rapide que le processeur AMD EPYC 7773X 2P.
Bien que ces processeurs Genoa testés aient une consommation d’énergie plus élevée que Milan, sur une base de performances par watt, ils faisaient bien mieux que les autres processeurs Intel/AMD.
Genoa fonctionnait bien dans les autres composants logiciels Intel optimisés AVX-512 qui font partie de leur collection oneAPI.
Le rayon OSPRay-Le moteur de traçage a remporté quelques victoires avec les processeurs Xeon Platinum 8380/8662 sur Milan/Milan-X, mais ce n’est plus le cas avec Genoa. OSPRay étant bien optimisé par Intel pour l’utilisation de l’AVX-512 sur leurs processeurs Xeon, il fonctionne aussi bien avec les nouveaux processeurs de serveur AVX-512 d’AMD.
Pour les charges de travail de rendu basées sur le processeur, les résultats de Genoa ont été formidables, en particulier dans des cas comme un seul EPYC 9654 capable de surpasser les configurations 2P EPYC 7773X ou 2P 7763.
Dans un benchmark Node.js à thread unique, Genoa était désormais en mesure de devancer Ice Lake grâce au Améliorations architecturales Zen 4.
Le benchmark d’analyse JSON simdjson n’est normalement pas intéressant pour les performances des gros serveurs, mais c’est maintenant que simdjson a un chemin optimisé AVX-512. Les processeurs de la série EPYC 9004 étaient désormais bien en avance sur Ice Lake grâce à la prise en charge de Zen 4 AVX-512.
La consommation d’énergie était également comparable à Ice Lake, les processeurs n’étant pas complètement saturés pour la référence d’analyse JSON..
L’EPYC 9554 offrait les meilleures performances par watt pour ce test d’analyse compatible AVX-512 pour des gigaoctets de données JSON.
Les tests de performances Python monothread ont également a montré les belles avancées avec Zen 4.
Et de très belles améliorations pour Numpy.
Les performances PHP monothread de Genoa étaient désormais dans un état comparable à celui d’Ice Lake , mais pour un serveur Web entièrement chargé, il y a bien sûr plus de capacité à trouver avec le Genoa et son nombre de cœurs/threads plus élevé.
Sur des charges de travail plus courantes comme la compression de fichiers/données, Zen 4 avec Genoa offre de belles améliorations progressives par rapport à Zen 3.
Gênes a remporté des victoires stellaires avec BRL-CAD.
Il y a eu une élévation générationnelle significative pour enjo y avec Genoa pour le logiciel de traitement de signal numérique open-source Liquid-DSP.
Pour faire court, parmi environ 200 benchmarks différents que j’ai effectués, les processeurs AMD EPYC 9654 et EPYC 9554 ont été un succès retentissant. Ils ont fourni une formidable amélioration générationnelle dans l’ensemble, mais surtout dans les nombreuses charges de travail HPC/serveur capables de tirer parti de l’AVX-512 et, à leur tour, ont élargi l’avance d’AMD sur les processeurs Xeon Scalable”Ice Lake”actuels.
Les résultats OpenFOAM avec EPYC Gênes était fantastique pour la dynamique des fluides computationnelle (CFD) open source.
OpenRadioss d’Altair se présente également très bien à Gênes. (Tous les processeurs n’ont pas été testés ici en raison de l’ajout tardif de cette nouvelle référence au cycle de révision des tests. Mais compte tenu de l’intérêt suscité par ce nouveau projet open source d’Altrair, voici ces points de référence pour les processeurs testés.)
Those wishing to see all of the benchmarks I ran in full can do so via this OpenBenchmarking.org result page that also has all the per-result CPU power data, performance-per-cost, etc.
Ci-dessus, un aperçu de la consommation électrique combinée observée pour toutes les configurations de processeur testées pendant toute la durée des tests effectués. Encore une fois, toutes les mesures de puissance du processeur proviennent des interfaces RAPL exposées sous Linux. L’EPYC 9554 dans son mode par défaut (déterminisme de performance) avait une consommation moyenne de 221 watts avec un pic de 355 watts, par rapport à l’EPYC 7763 avec une moyenne de 170 watts et un pic de 286 watts, mais lors de l’activation du mode de déterminisme de puissance, il a bondi à une moyenne de 234 watts avec un pic de 404 watts. Pendant ce temps, l’EPYC 9654 à 96 cœurs phare avait une consommation moyenne de 223 watts et un pic de 363 watts, ou une moyenne de 256 watts en mode déterminisme de puissance et un pic de 415 watts. En mode EPYC 9654 2P, c’était une moyenne de 366 watts et un pic de 697 watts ou en mode déterminisme de puissance, une moyenne de 443 watts et un pic de 833 watts. La consommation d’énergie est plus élevée avec ces nouveaux processeurs Socket SP5, mais comme le montrent de nombreuses mesures de performance par watt, en ce qui concerne l’efficacité énergétique, il est souvent en avance sur AMD EPYC 7003″Milan”ou dans le pire des cas, les performances étaient à peu près similaires. par watt à ces pièces de la génération précédente. Ainsi, les augmentations de puissance sont justifiées et il existe également des processeurs EPYC 9004″Genoa”inférieurs si vous ne souhaitez pas entrer dans la plage des 300 à 400 watts.
En prenant la moyenne géométrique de tous les benchmarks qui ont fonctionné avec succès tous les processeurs, voici comment les choses se passent. Même un seul EPYC 9554 devance globalement la configuration 2P EPYC 7773X… AMD EPYC de 4e génération est excellent avec son implémentation AVX-512, sa mémoire système DDR5, ses douze canaux de mémoire et d’autres améliorations architecturales Zen 4. L’EPYC 9554 2P à 64 cœurs était 64 % plus rapide que la configuration globale de l’EPYC 7763 2P à 64 cœurs, ou 67 % si l’EPYC 9554 2P était exécuté en mode déterminisme de puissance. Pendant ce temps, le produit phare EPYC 9654 2P était 74% plus rapide que le EPYC 7763 2P ou qui est passé à 85% lorsque les processeurs phares de Genoa fonctionnaient en mode déterminisme de puissance. L’AMD EPYC 9654 2P fonctionnait à plus de 2 fois la vitesse du fleuron actuel d’Intel, les processeurs Xeon Scalable 8380 2P”Ice Lake”.
Le soulèvement générationnel de Milan à Gênes a été incroyable à travers le large éventail de benchmarks de serveurs et HPC que j’ai effectués. Je suis maintenant laissé à rêver à quoi ressemblera Genoa-X l’année prochaine en sachant qu’il y a encore plus de potentiel pour sortir de Zen 4 côté serveur ainsi que des processeurs Bergame de l’année prochaine pour jusqu’à 128 cœurs pour se concentrer sur le cloud calcul des charges de travail.
Comme je l’ai déjà beaucoup montré du côté du bureau de la série Ryzen 7000, l’implémentation AVX-512 d’AMD Zen 4 est remarquablement efficace et cela est encore plus vrai du côté du serveur. Avec des charges de travail encore plus pertinentes ici capables d’utiliser l’AVX-512 et une amélioration étonnante, comme indiqué dans ces tests de performance.
Sur la base du prix du processeur, la série EPYC 9004 est compétitive avec l’EPYC 7003 existant”Processeurs Milan(X)”et processeurs Xeon Scalable Ice Lake. Cependant, la transition vers Gênes signifie également avoir besoin d’une mémoire système DDR5 ECC plus chère que la DDR4. Je n’ai pas encore reçu d’informations avancées sur les prix des cartes mères de vente au détail EPYC Genoa, donc je ne sais pas comment cela se déroulera, mais vraisemblablement avec le Socket SP5 plus complexe et les exigences de puissance plus élevées, il entraînera des prix relatifs plus élevés par rapport à ce que nous avons vu avec les cartes mères EPYC SP3. Les processeurs EPYC Milan continueront d’être disponibles pour ceux qui recherchent des serveurs moins chers, mais avec des performances toujours très saines.
Du côté du support Linux, le noyau Linux en amont et d’autres clés les composants sont en bon état pour une prise en charge au lancement avec la série EPYC 9004… Certes, c’est plutôt une donnée avec la part de marché actuelle des serveurs Linux. Mais AMD a encore de la place pour faire des progrès dans son support Linux/open-source. Par exemple, AMD était en retard avec ses correctifs IBRS automatiques pour le noyau Linux en ne les publiant que la semaine dernière. C’est également uniquement avec Linux 6.1 que le cache à cache du processeur AMD et les rapports de mémoire avec perf arrivent, pour ceux qui s’intéressent à ces capacités de profilage étendues. La fonctionnalité LbrExtV2 Last Branch Record, nouvelle pour Zen 4, n’est également disponible qu’avec Linux 6.1. Pendant ce temps, Linux 6.0 a remplacé AMD X2AVIC pour les machines virtuelles KVM. La prise en charge de la qualité de service autour de l’allocation lente de la bande passante mémoire avec la mémoire CXL et la configuration des événements de surveillance de la bande passante (BMEC) n’est pas encore intégrée au noyau Linux, mais disponible sous forme de correctif. Il y a donc quelques fonctionnalités non critiques qui ont vu des arrivées tardives pour le noyau Linux principal, mais au moins en termes de support clé, il est en bonne forme pour le lancement. Bien sûr, une fois que les fonctionnalités atteignent la ligne principale, il y a aussi du temps supplémentaire avant de trouver ces noyaux utilisés par diverses distributions Linux ou rétroportés vers les versions de noyau d’entreprise pour RHEL et SLES. Sur une note positive, la ligne de tendance de l’amont Linux d’AMD pour le délai de pré-lancement s’est améliorée pour les générations successives de processeurs EPYC/Zen (en grande partie parce qu’ils ont embauché beaucoup plus d’ingénieurs Linux au cours des deux dernières années).
Il y a toujours l’angle malheureux de la prise en charge sans doute tardive du réglage du compilateur pour cette nouvelle génération de processeurs. Ce n’est qu’à la mi-octobre qu’AMD a envoyé son support de compilateur Znver4 pour GCC qui a ajouté la cible”-march=znver4″et a ensuite été fusionné avec GCC 13 Git fin octobre. Mais avec ce support initial, il reporte la table de coût/réglage de Znver3–le réglage Znver4 est prévu”plus tard”. Espérons que ce support optimisé arrivera toujours à temps pour GCC 13, qui à son tour devrait voir sa version stable en tant que GCC 13.1 vers mars ~ avril de l’année prochaine. Mais ce ne sera pas avant la plupart des versions de distribution Linux H2’2023 comme Ubuntu 23.10 où GCC 13 est utilisé comme compilateur système par défaut. Si AMD avait obtenu son support Znver4 dans GCC bien avant le lancement (comme Intel est connu pour avoir mis au carré une grande partie de leur activation Sapphire Rapids et AMX pour GCC 12), il pourrait déjà être livré dans Ubuntu 22.04 LTS et d’autres distributions récentes. Il existe également un correctif Znver4 pour GNU Binutils qui figure sur la liste de diffusion et, au moment de la rédaction de cet article, n’a pas encore été fusionné.
Ou en d’autres termes, dans la version annuelle du compilateur GCC 13 où AMD est ne faisant que commencer leur support Zen 4, Intel a déjà travaillé et fusionné pour le support GCC 13 pour divers processeurs 2023 ~ 2024. GCC 13 a déjà mis en file d’attente Grand Ridge et Granite Rapids, Meteor Lake, Sierra Forest, et cela comprenait l’activation de diverses nouvelles instructions fournies avec ces processeurs. C’est ce genre de support rapide que j’aimerais voir de la part d’AMD (et il y a de nombreuses années, ils étaient ponctuels avec leur support GCC précoce) de sorte qu’au moment où ces processeurs seront expédiés, le support Znver4 serait idéalement déjà dans une version publiée/compilateur stable trouvé par les dernières distributions Linux. Au moment de la rédaction, aucun correctif Znver4 n’a été publié pour examen en amont du côté LLVM/Clang alors qu’il y a au moins une cadence de publication de six mois. Intel continue d’être en tête du côté des logiciels en ce qui concerne leur synchronisation stellaire open-source/Linux dans la grande majorité des cas au cours des dernières années. Le calendrier d’activation en amont est une bête noire récurrente que j’ai avec AMD à chaque cycle de lancement ; du côté du compilateur, la seule raison logique que j’ai est qu’ils veulent jouer leurs cartes près du gilet et ne pas révéler trop tôt de nouveaux plans d’extension ISA pour les futures générations de processeurs.
Certes, sauf si vous compilez optimisé code pour la cible CPU du serveur, cette prise en charge du compilateur Znver4 ne vous pose pas beaucoup (ou pas du tout). Mais étant donné l’attrait croissant d’AMD dans le domaine du calcul haute performance (HPC), il est un peu surprenant qu’ils n’aient pas poussé ce support de compilateur plus tôt. Il devrait au moins y avoir bientôt une nouvelle version du compilateur AMD Optimizing C/C++ (AOCC) où Zen 4 sera en bonne forme. Une fois cette nouvelle version AOCC sortie, j’exécuterai certainement des benchmarks de compilateur sur Genoa pour examiner l’impact de la prise en charge du compilateur optimisé sur ces processeurs de serveur Zen 4.
En plus des performances exceptionnelles et de la prise en charge de Linux pour le lancement, un autre aspect passionnant de l’EPYC de 4e génération du côté de la plate-forme de référence est Titanite fonctionnant avec OpenBMC ! C’était excitant de voir OpenBMC open source basé sur Linux utilisé comme pile logicielle pour le BMC de référence et j’espère que cela se poursuivra pour voir OpenBMC être utilisé par davantage de serveurs de la série EPYC 9004. De plus, nous espérons que l’intérêt de l’industrie/des clients pour les micrologiciels open source se poursuivra et qu’AMD pourra s’engager davantage autour de Coreboot et d’autres éléments de micrologiciel open source.
Comment Intel Sapphire Rapids se compare à l’EPYC de 4e génération sera une bataille intéressante. Sapphire Rapids ne montera que jusqu’à 60 cœurs contre 96 cœurs avec Genoa, mais à l’avantage d’Intel, les nouvelles extensions Advanced Matrix Extensions (AMX), AVX-512 FP16 et divers nouveaux blocs accélérateurs. Pour les logiciels capables de tirer parti d’AMX et de l’accélérateur IP d’Intel, ce sera une compétition très intéressante au moins pour Gênes, mais pour les charges de travail de serveur plus traditionnelles, cela présentera un défi assez important-dois-je vous rappeler que la moyenne géographique sur l’EPYC 9654 2P était 2x celle du Xeon Platinum 8380 2P. Il sera également intéressant de voir comment Intel rivalise avec la série EPYC 9004 en matière de prix, en particulier avec Sapphire Rapids introduisant Intel On Demand/Software Defined Silicon qui complique davantage la scène des prix, en particulier s’il est lié aux nouveaux blocs accélérateurs qui deviennent primordiaux pour offrir des performances compétitives.. Un domaine qui sera intéressant pour Intel avec Sapphire Rapids est leurs références HBM2e désormais connues sous le nom de Xeon Max, tandis que l’année prochaine, AMD aura Genoa-X à annoncer. Parmi les autres avantages des processeurs de la série AMD EPYC de 4e génération, citons la prise en charge de CXL 1.1+ et la prise en charge étendue de SEV-SNP avec des capacités de cryptage de mémoire accrues et davantage de machines virtuelles.