bis zu 2-mal höhere Leistung und 2,8-fache Effizienz bietet

In einem neuen technischer Blog hat NVIDIA endlich einige Zahlen veröffentlicht, in denen sein bestehender Ampere A100-Beschleuniger mit den AMD Instinct MI250-GPUs verglichen wird.

NVIDIA Behauptet 2-mal höhere Leistung und fast 3-fache Effizienz für Ampere A100-GPUs im Vergleich zu AMDs Instinct MI250

NVIDIA hat bereits seine H100-GPU der nächsten Generation angekündigt, die auf der Hopper-Grafikarchitektur (GPU) basiert und später an Kunden ausgeliefert wird Jahr. Die Hopper-GPU wird eine geschätzte 26-fache Leistungssteigerung gegenüber dem Pascal P100 liefern, das vor sechs Jahren veröffentlicht wurde, und das ist 3-mal schneller als die von Moores Gesetz vorgegebene Flugbahn.

NVIDIA zeigt ConnectX-7 auf der ISC 2022: Switch der nächsten Generation mit 8 Milliarden Transistoren

Zu den Leistungstests kommend, hat NVIDIA die Ampere A100 GPU sowohl in Single-als auch in Multi-GPU-Konfigurationen getestet. Dieselben Konfigurationen wurden für den Instinct MI250 von AMD verwendet. Einige der beliebtesten Rechenzentrums-Workloads wie LAMMPS, NAMD, openMM, GROMACS und AMBER wurden für Leistungstests verwendet.

NVIDIAs einzelne Ampere A100-GPU erwies sich als bis zu 1,9-mal schneller als AMD Instinct MI250 GPU-Beschleuniger, während die Quad-GPU-Lösung einen bis zu 2,1-fachen Gewinn für das Ampere-System zeigte. In puncto Energieeffizienz bot die Quad-GPU-Lösung eine 2,8-mal höhere Leistung/Watt.

Die hervorragende Leistung und Energieeffizienz der NVIDIA A100-GPU ist das Ergebnis jahrelanger unermüdlicher Software-Hardware-Kooperation-Optimierung zur Maximierung der Anwendungsleistung und-effizienz. Weitere Informationen zur NVIDIA Ampere-Architektur finden Sie im NVIDIA A100 Tensor Core GPU Whitepaper.

Der A100 stellt sich für das Betriebssystem auch als Einzelprozessor dar, sodass nur ein MPI-Rang gestartet werden muss, um dessen Vorteile voll auszuschöpfen Leistung. Und A100 bietet dank der 600-GB/s-NVLink-Verbindungen eine hervorragende Leistung im großen Maßstab  zwischen allen GPUs in einem Knoten.

Im Folgenden finden Sie die Anmerkungen zu den Tests:

Effizienzverhältnis von A100 bis MI250 abgebildet – höher ist besser für NVIDIA. Geomean über mehrere Datensätze (variiert) pro Anwendung. Effizienz ist Leistung/Energieverbrauch (Watt), gemessen für die GPUs unter Verwendung von NVIDIA SMI und gleichwertiger Funktionalität in ROCm |

AMD MI250, gemessen auf einem GIGABYTE M262-HD5-00 mit (2) AMD EPYC 7763 mit 4 x AMD Instinct™ MI250 OAM (128 GB HBM2e) 500-W-GPUs mit AMD Infinity Fabric™-Technologie. NVIDIA läuft auf ProLiant XL645d Gen10 Plus mit zwei EPYC 7713 CPUs und 4x A100 (80 GB) SXM4

LAMMPS development_db00b49(AMD) developer_2a35ec2(NVIDIA) Datensätze ReaxFF/c, Tersoff, Leonard-Jones, SNAP   | NAMD 3.0alpha9-Datensatz STMV_NVE | OpenMM 7.7.0 Ensemble läuft für Datensätze: amber20-stmv, amber20-cellulose, apoa1pme, pme|

GROMACS 2021.1(AMD) 2022(NVIDIA) Datensätze  ADH-Dodec (h-bond), STMV (h-Anleihe) | AMBER 20.xx_rocm_mr_202108(AMD) und 20.12-AT_21.12 (NVIDIA) Datensätze Cellulose_NVE, STMV_NVE | 1x MI250 hat 2x GCD

über NVIDIA

Nun sei angemerkt, dass der hier verwendete AMD Instinct MI250 nicht die volle Konfiguration ist, da dieser auf dem MI250X sitzt aber Basierend auf diesen Ergebnissen sollte der A100 immer noch sehr konkurrenzfähig gegenüber den AMD CDNA 2-Angeboten sein. Mit dem bald erscheinenden Hopper wird NVIDIA diese Zahlen noch weiter steigern und hier kommt AMDs Instinct MI300 mit seinem brandneuen APU-ähnlichen Design ins Spiel.

Categories: IT Info