Dans un nouveau blog technique, NVIDIA a enfin partagé quelques chiffres comparant son accélérateur Ampere A100 existant aux GPU AMD Instinct MI250.

NVIDIA Revendique des performances 2x supérieures et une efficacité presque 3x pour les GPU Ampere A100 par rapport à l’Instinct MI250 d’AMD

NVIDIA a déjà annoncé son GPU H100 de nouvelle génération basé sur l’architecture graphique Hopper (GPU) qui sera expédié aux clients plus tard cette an. Le GPU Hopper offrira une augmentation des performances estimée à 26 fois par rapport au Pascal P100 sorti il ​​y a six ans et c’est 3 fois plus rapide que la trajectoire offerte par la loi de Moore.

NVIDIA présente ConnectX-7 à l’ISC 2022: Commutateur de nouvelle génération avec 8 milliards de transistors

En ce qui concerne les tests de performances, NVIDIA a testé le GPU Ampere A100 dans des configurations mono et multi-GPU. Les mêmes configurations ont été utilisées pour l’Instinct MI250 d’AMD. Certaines des charges de travail les plus populaires des centres de données, telles que LAMMPS, NAMD, openMM, GROMACS et AMBER, ont été utilisées pour les tests de performances.

Le GPU Ampère A100 unique de NVIDIA s’est avéré être jusqu’à 1,9 fois plus rapide que l’AMD Accélérateur GPU Instinct MI250 tandis que la solution quad-GPU a montré jusqu’à un gain de 2,1x pour le système Ampere. En termes d’efficacité énergétique, la solution quad-GPU a fourni 2,8 fois plus de performances/watt.

Les excellentes performances et l’efficacité énergétique du GPU NVIDIA A100 sont le résultat de nombreuses années de collaboration logicielle-matérielle incessante.-Optimisation pour maximiser les performances et l’efficacité des applications. Pour plus d’informations sur l’architecture NVIDIA Ampere, consultez le Livre blanc sur le GPU NVIDIA A100 Tensor Core.

A100 se présente également comme un processeur unique pour le système d’exploitation, nécessitant qu’un seul rang MPI soit lancé pour tirer pleinement parti de sa performance. De plus, l’A100 offre d’excellentes performances à grande échelle grâce aux connexions NVLink de 600 Go/s  entre tous les GPU d’un nœud.

Voici les notes des tests :

Rapport d’efficacité de A100 à MI250 illustré-plus c’est mieux pour NVIDIA. Géomoyenne sur plusieurs ensembles de données (varie) par application. L’efficacité est la performance/la consommation d’énergie (Watts) telle que mesurée pour les GPU utilisant mesurée à l’aide de NVIDIA SMI et des fonctionnalités équivalentes dans ROCm |

AMD MI250 mesurée sur un GIGABYTE M262-HD5-00 avec (2) AMD EPYC 7763 avec 4 GPU AMD Instinct™ MI250 OAM (128 Go HBM2e) 500 W dotés de la technologie AMD Infinity Fabric™. NVIDIA fonctionne sur ProLiant XL645d Gen10 Plus avec deux processeurs EPYC 7713 et 4x A100 (80 Go) SXM4

LAMMPS develop_db00b49(AMD) develop_2a35ec2(NVIDIA) jeux de données ReaxFF/c, Tersoff, Leonard-Jones, SNAP   | Jeu de données NAMD 3.0alpha9 STMV_NVE | OpenMM 7.7.0 Ensemble s’exécute pour les ensembles de données : amber20-stmv, amber20-cellulose, apoa1pme, pme|

Ensembles de données GROMACS 2021.1(AMD) 2022(NVIDIA)  ADH-Dodec (h-bond), STMV (h-bond) | Ensembles de données AMBER 20.xx_rocm_mr_202108(AMD) et 20.12-AT_21.12 (NVIDIA) Cellulose_NVE, STMV_NVE | 1x MI250 a 2x GCD

via NVIDIA

Maintenant, il convient de noter que l’AMD Instinct MI250 utilisé ici n’est pas la configuration complète car il se trouve sur le MI250X mais sur la base de ces résultats, l’A100 devrait toujours être très compétitif par rapport aux offres AMD CDNA 2. Avec l’arrivée prochaine de Hopper, NVIDIA poussera ces chiffres encore plus loin et c’est là que l’Instinct MI300 d’AMD entre en jeu avec son tout nouveau design de type APU.

Categories: IT Info