NVIDIA A100 PCIe 80GB

NVIDIA secara resmi memperkenalkan varian A100 dengan antarmuka PCI Express dan memori 80GB.

Pada bulan November NVIDIA memperkenalkan varian 80GB dari akselerator A100 berdasarkan faktor bentuk SXM4. Varian ini menawarkan kapasitas memori dua kali lipat dari model asli berbasis Ampere GA100 serta bandwidth yang lebih tinggi. Tujuh bulan kemudian, NVIDIA juga memperkenalkan model berbasis PCIe yang menampilkan fitur yang sama persis, kecuali pada antarmuka standar dan dengan TDP yang lebih rendah.

NVIDIA A100 PCIe 80GB adalah berdasarkan 7nm Am pere GA100 GPU menampilkan 6192 CUDA core. Bandwidth pada varian ini meningkat menjadi 2039 GB/dtk (lebih dari 484 GB/dtk lebih dari A100 40GB). Hal ini dicapai dengan menggunakan memori yang lebih cepat dengan kecepatan efektif 3186 Gbps.

GPU ini berorientasi komputer yang berarti tidak memiliki tujuan bermain game, setidaknya tidak dalam bentuk ini. Produk ini khusus untuk komputasi berperforma tinggi guna mempercepat pelatihan menggunakan algoritme pembelajaran dalam.

Selanjutnya, NVIDIA mengumumkan fitur Penyimpanan GPUDirect, yang mirip dengan teknologi Microsoft DirectStorage konsumen. Di ruang konsumen, ini memberikan akses ke penyimpanan NVMe cepat yang dapat meningkatkan waktu pemuatan dalam beban kerja tertentu. Teknologi NVIDIA tampaknya berfokus pada jenis akses yang serupa kecuali ke kumpulan memori besar pada GPU, dalam hal ini, memori HBM2e 80 GB yang lebih cepat.

9,7 TFLOPS

Seri Akselerator Komputasi NVIDIA (Sebelumnya Tesla)
VideoCardz.com A100 PCIe A100 SXM Tesla V100s Tesla V100 Tesla P100
Gambar
GPU GA100 7nm GA100 7nm GV100 12nm GV100 12nm GP100 16nm
Ukuran Die

826 ​​mm^2

826 ​​mm^2

815 mm^2

815 mm^2

610 mm^2

Transistor

54 miliar

54 bil pada

21,1 miliar

21,1 miliar

15,3 miliar

SM
Core CUDA
Core Tensor NA
Komputasi FP16

78 TFLOPS

78 TFLOPS

32,8 TFLOPS

31.4 TFLOPS

21.2 TFLOPS

Komputasi FP32

19,5 TFLOPS

19,5 TFLOPS

16,4 TFLOPS

15.7 TFLOPS

10.6 TFLOPS

Komputasi FP64

9,7 TFLOPS

8.2 TFLOPS

7.8 TFLOPS

5.3 TFLOPS

Peningkatan Jam

~1410MHz

~1410MHz

~1601 MHz

~1533 MHz

~1480MHz

Bandwidth

2039/1555 GB/s

2039/1555 GB/dtk

1134 GB/dtk

900 GB/dtk

721 GB/dtk

Eff. Jam Memori

3186/2430 Gbps

3186/2430 Gbps

2214 Gbps

1760 Gbps

1408 Gbps

Konfigurasi Memori.

80/40GB HBM2e

80/40 GB HBM2e

32 GB HBM2

16/32 GB HBM2

16 GB HBM2

Bus Memori

5120-bit

5120-bit

4096-bit

4096-bit

4096-bit

TDP
Faktor Bentuk PCIe 4.0 SXM4 PCIe 3.0 SXM2/PCIe 3.0 SXM

Sumber: HardwareLuxx



Categories: IT Info