NVIDIA A100 PCIe 80 Go

NVIDIA présente officiellement sa variante A100 avec une interface PCI Express et 80 Go de mémoire.

En novembre, NVIDIA a introduit une variante de 80 Go de l’accélérateur A100 basée sur le facteur de forme SXM4. Cette variante offrait deux fois la capacité de mémoire du modèle original basé sur Ampere GA100 ainsi qu’une bande passante plus élevée. Sept mois plus tard, NVIDIA présente également un modèle basé sur PCIe présentant exactement les mêmes fonctionnalités, sauf sur une interface standard et avec un TDP inférieur.

NVIDIA A100 PCIe 80GB est basé sur 7 nm Am GPU pere GA100 avec 6192 cœurs CUDA. La bande passante sur cette variante passe à 2039 Go/s (plus de 484 Go/s plus que A100 40 Go). Ceci est réalisé en utilisant une mémoire plus rapide avec une vitesse effective de 3186 Gbps.

Ce GPU est orienté ordinateur, ce qui signifie qu’il n’a pas d’objectif de jeu, du moins pas sous cette forme. Ce produit est strictement destiné au calcul haute performance pour accélérer la formation à l’aide d’algorithmes d’apprentissage en profondeur.

En outre, NVIDIA a annoncé sa fonctionnalité GPUDirect Storage, qui est similaire à la technologie Microsoft DirectStorage grand public. Dans l’espace grand public, il donne accès à un stockage NVMe rapide qui peut augmenter les temps de chargement dans certaines charges de travail. La technologie de NVIDIA semble se concentrer sur un type d’accès similaire, à l’exception du grand pool de mémoire sur le GPU, dans ce cas, 80 Go de mémoire HBM2e plus rapide.

9.7 TFLOPS

NVIDIA Compute Accelerator Series (anciennement Tesla)
VideoCardz.com A100 PCIe A100 SXM Tesla V100 Tesla V100 Tesla P100
Photo
GPU 7nm GA100 7nm GA100 12nm GV100 12nm GV100 16nm GP100
Taille de la matrice

826 ​​mm^2

826 ​​mm^2

815 mm^2

815 mm^2

610 mm^2

Transistors

54 milliards

54 milliards sur

21,1 milliards

21,1 milliards

15,3 milliards

SM
Cœurs CUDA
Tensor Cores NA
Calcul FP16

78 TFLOPS

78 TFLOPS

32,8 TFLOPS

31,4 TFLOPS

21,2 TFLOPS

Calcul FP32

19.5 TFLOPS

19,5 TFLOPS

16,4 TFLOPS

15.7 TFLOPS

10.6 TFLOPS

Calcul FP64

9.7 TFLOPS

8.2 TFLOPS

7.8 TFLOPS

5.3 TFLOPS

Boost Horloge

~1410MHz

~1410MHz

~1601 MHz

~1533 MHz

~1480MHz

Bande passante

2039/1555 Go/s

2039/1555 Go/s

1134 Go/s

900 Go/s

721 Go/s

Eff. Horloge mémoire

3186/2430 Gbps

3186/2430 Gbps

2214 Gbps

1760 Gbps

1408 Gbps

Configuration mémoire

80/40 Go HBM2e

80/40 Go HBM2e

32 Go HBM2

16/32 Go HBM2

16 Go HBM2

Bus mémoire

5120 bits

5120 bits

4096 bits

4096 bits

4096 bits

TDP
Facteur de forme PCIe 4.0 SXM4 PCIe 3.0 SXM2/PCIe 3.0 SXM

Source : HardwareLuxx



Categories: IT Info