NVIDIA A100 PCIe 80 GB

NVIDIA oficjalnie przedstawia swój wariant A100 z interfejsem PCI Express i 80 GB pamięci.

W listopadzie firma NVIDIA wprowadziła 80-gigabajtowy wariant akceleratora A100 oparty na obudowie SXM4. Ten wariant oferował dwukrotnie większą pojemność pamięci niż oryginalny model oparty na Ampere GA100, a także większą przepustowość. Siedem miesięcy później NVIDIA wprowadza również model oparty na PCIe, który oferuje dokładnie te same funkcje, z wyjątkiem standardowego interfejsu i niższego TDP.

NVIDIA A100 PCIe 80GB to w oparciu o 7 nm Am Procesor graficzny pere GA100 wyposażony w 6192 rdzenie CUDA. Przepustowość w tym wariancie wzrasta do 2039 GB/s (ponad 484 GB/s więcej niż A100 40 GB). Osiąga się to przy użyciu szybszej pamięci o efektywnej prędkości 3186 Gb/s.

Ten procesor graficzny jest zorientowany na komputer, co oznacza, że ​​nie służy do gier, przynajmniej nie w tej formie. Ten produkt jest przeznaczony wyłącznie do obliczeń o wysokiej wydajności w celu przyspieszenia szkolenia przy użyciu algorytmów uczenia głębokiego.

Ponadto, NVIDIA ogłosiła swoją funkcję GPUDirect Storage, która jest podobna do konsumenckiej technologii Microsoft DirectStorage. W przestrzeni konsumenckiej daje dostęp do szybkiej pamięci masowej NVMe, która może przyspieszyć ładowanie w przypadku niektórych obciążeń. Wydaje się, że technologia NVIDIA koncentruje się na podobnym typie dostępu, z wyjątkiem dużej puli pamięci na GPU, w tym przypadku 80 GB szybszej pamięci HBM2e.

9,7 TFLOPS

Seria akceleratorów obliczeniowych NVIDIA (dawniej Tesla)
VideoCardz.com A100 PCIe A100 SXM Tesla V100 Tesla V100 Tesla P100
Obraz >
GPU 7 nm GA100 7 nm GA100 12 nm GV100 12 nm GV100 16 nm GP100
Rozmiar matrycy

826 ​​mm^2

826 ​​mm^2

815 mm^2

815 mm^2

610 mm^2

Tranzystory

54 miliardy

54 miliardy na

21,1 miliarda

21,1 miliarda

15,3 miliarda

SM
Rdzenie CUDA
Rdzenie tensorowe NA
FP16 Compute

78 TFLOPS

78 TFLOPS

32,8 TFLOPS

31,4 TFLOPS

21,2 TFLOPS

FP32 Compute

19,5 TFLOPS

19,5 TFLOPS

16,4 TFLOPS

15,7 TFLOPS

10,6 TFLOPS

Obliczenia FP64

9,7 TFLOPS

8,2 TFLOPS

7,8 TFLOPS

5.3 TFLOPS

Wzmocnienie Zegar

~1410 MHz

~1410 MHz

~1601 MHz

~1533 MHz

~1480 MHz

Przepustowość

2039/1555 GB/s

2039/1555 GB/s

1134 GB/s

900 GB/s

721 GB/s

Eff. Zegar pamięci

3186/2430 Gb/s

3186/2430 Gb/s

2214 Gb/s

1760 Gb/s

1408 Gb/s

Konfiguracja pamięci

80/40GB HBM2e

HBM2e 80/40 GB

HBM2 32 GB

16/32 GB HBM2

16 GB HBM2

Magistrala pamięci

5120 bitów

5120 bitów

4096-bitów

4096-bitów

4096-bitowy

TDP
Współczynnik kształtu PCIe 4.0 SXM4 PCIe 3.0 SXM2/PCIe 3.0 SXM

Źródło: HardwareLuxx



Categories: IT Info