W nowej blog techniczny, NVIDIA w końcu podzieliła się niektórymi liczbami porównującymi jej istniejący akcelerator Ampere A100 z procesorami graficznymi AMD Instinct MI250.
NVIDIA Twierdzi, że 2x wyższa wydajność i prawie 3x wydajność dla procesorów graficznych Ampere A100 w porównaniu z AMD Instinct MI250
NVIDIA już zapowiedziała nową generację GPU H100 opartą na architekturze grafiki Hopper (GPU), która zostanie dostarczona do klientów później w tym roku rok. GPU Hopper zapewni szacunkowo 26-krotny wzrost wydajności w porównaniu z Pascalem P100, który został wprowadzony na rynek sześć lat temu, i jest to 3 razy szybszy niż trajektoria oferowana przez prawo Moore’a.
NVIDIA prezentuje ConnectX-7 na ISC 2022: Przełącznik nowej generacji z 8 miliardami tranzystorów
W związku z tym, przechodząc do testów wydajności, NVIDIA przetestowała procesor graficzny Ampere A100 zarówno w konfiguracjach z jednym, jak i wieloma procesorami graficznymi. Te same konfiguracje zostały użyte dla Instinct MI250 firmy AMD. Niektóre z najpopularniejszych obciążeń Data Center, takie jak LAMMPS, NAMD, openMM, GROMACS i AMBER, zostały użyte do testów wydajności.
Pojedynczy procesor graficzny NVIDIA Ampere A100 okazał się do 1,9 razy szybszy niż AMD Akcelerator GPU Instinct MI250, podczas gdy rozwiązanie z czterema GPU wykazywało do 2,1x wzmocnienie dla systemu Ampere. Jeśli chodzi o efektywność energetyczną, rozwiązanie z czterema procesorami graficznymi zapewniało 2,8 razy wyższą wydajność na wat.
Doskonała wydajność i energooszczędność procesora graficznego NVIDIA A100 jest wynikiem wielu lat nieustannej współpracy programowo-sprzętowej.-optymalizacja w celu maksymalizacji wydajności i wydajności aplikacji. Więcej informacji na temat architektury NVIDIA Ampere można znaleźć w NVIDIA A100 Tensor Core GPU dokument.
A100 przedstawia się również jako pojedynczy procesor w systemie operacyjnym, co wymaga uruchomienia tylko jednego rankingu MPI, aby w pełni wykorzystać jego wydajność. A100 zapewnia doskonałą wydajność na dużą skalę dzięki połączeniom NVLink 600 GB/s pomiędzy wszystkimi procesorami graficznymi w węźle.
1/p>
Poniżej znajdują się uwagi z testów:
Współczynnik wydajności Pokazano A100 do MI250 – wyższy jest lepszy dla NVIDII. Geomean dla wielu zestawów danych (różnych) na aplikację. Wydajność to wydajność/zużycie energii (w watach) mierzone dla procesorów graficznych mierzone przy użyciu NVIDIA SMI i równoważnej funkcjonalności w ROCm |
AMD MI250 zmierzone na GIGABYTE M262-HD5-00 z (2) AMD EPYC 7763 z 4 procesorami graficznymi AMD Instinct™ MI250 OAM (128 GB HBM2e) 500 W z technologią AMD Infinity Fabric™. NVIDIA działa na ProLiant XL645d Gen10 Plus przy użyciu dwóch procesorów EPYC 7713 i 4x A100 (80 GB) SXM4
LAMMPS development_db00b49(AMD) development_2a35ec2(NVIDIA) zestawów danych ReaxFF/c, Tersoff, Leonard-Jones, SNAP | Zbiór danych NAMD 3.0alpha9 STMV_NVE | OpenMM 7.7.0 Ensemble działa dla zestawów danych: amber20-stmv, amber20-celuloza, apoa1pme, pme|
GROMACS 2021.1(AMD) 2022(NVIDIA) datasets ADH-Dodec (h-bond), STMV (h-obligacja) | AMBER 20.xx_rocm_mr_202108(AMD) i 20.12-AT_21.12 (NVIDIA) zestawy danych Cellulose_NVE, STMV_NVE | 1x MI250 ma 2x GCD
przez NVIDIA
Teraz należy zauważyć, że zastosowany tutaj AMD Instinct MI250 nie jest pełną konfiguracją, ponieważ znajduje się na MI250X, ale w oparciu o te wyniki, A100 nadal powinien być bardzo konkurencyjny w stosunku do oferty AMD CDNA 2. Wraz ze zbliżającym się Hopperem, NVIDIA podniesie te liczby jeszcze dalej i właśnie tam pojawia się AMD Instinct MI300 z zupełnie nową konstrukcją podobną do APU.