A NVIDIA expandiu ainda mais sua linha de data center profissional de GPUs Ampere com o acelerador de GPU A2 Tensor Core. O novo acelerador é o design de nível mais básico que vimos da NVIDIA e apresenta algumas especificações decentes com base em sua designação de mercado de nível básico.

NVIDIA A2 Tensor Core GPU é um design de centro de dados básico movido a Por Ampere GA107

A GPU NVIDIA A2 Tensor Core foi projetada especificamente para inferir e substitui a GPU T4 Tensor Core com base em Turing. Em termos de especificações, a placa apresenta uma variante do SKU de GPU Ampere GA107 que oferece 1280 núcleos CUDA e 40 núcleos Tensor. Esses núcleos funcionam a uma frequência de clock de 1,77 GHz e são baseados no nó de processo Samsung 8nm. Apenas os SKUs de GPU GA100 de ponta são baseados no nó de processo TSMC 7nm.

NVIDIA anuncia plataformas AGX Orin e Jetson AGX Orin com tecnologia Orin SOC: 12 núcleos de CPU Hercules ARM e GPU Ampere

O design de memória compreende uma capacidade GDDR6 de 16 GB que funciona em uma interface de barramento de 128 bits, com clock de 12,5 Gbps efetivamente para uma largura de banda total de 200 GB/s. A GPU está configurada para operar em um TDP entre 40 e 60 Watts. Devido ao seu design básico, ele também vem em um design de fator de forma pequeno com fator de forma de meia altura e meio comprimento que é resfriado passivamente. Devido ao seu baixo TDP, ele não requer nenhum conector de alimentação externo para inicializar. A placa também possui uma interface PCIe Gen 4.0 x8 em vez do link x16 padrão.

A GPU NVIDIA A2 Tensor Core fornece inferência de nível básico com baixo consumo de energia, pegada pequena e alto desempenho para NVIDIA AI no limite. Apresentando uma placa PCIe Gen4 de baixo perfil e uma capacidade de design térmico configurável (TDP) de 40-60 W, o A2 traz aceleração de inferência versátil para qualquer servidor para implantação em escala.

via NVIDIA

Em termos de desempenho, o os números de computação são avaliados em 4,5 TFLOPs (FP32), 0,14 TFLOPs (FP64), 36 TOPs (INT8), 18 TFLOPs (FP16 Tensor) e 9 TFLOPs (TF32) Tensor. Comparando o desempenho do IVA com um NVIDIA T4, o A2 oferece até 30% de melhoria junto com o consumo de energia muito menor. A GPU NVIDIA A2 Tensor Core está disponível a partir de agora, embora não haja detalhes específicos compartilhados sobre o preço da placa.

Linha de GPU profissional NVIDIA Ampere

GPU NameA100A40A30A16A10A2 Processo NodeTSMC 7nmSamsung 8nmTSMC 7nmSamsung 8nmSamsung 8nmSamsung 8nm GPU SKUGA100-884GA102-895GA100-8904x GA107GA102-890GA107 Transistores GPU54.2B28.3B54.2BTBA28.3BTBA CUDA Cores1.7480 ou 480 Hz480 Hz1 Hz4.694 Hz4 80 Hz4 Hz4 Hz1 Hz4.280 Hz480 Hz416 Hz1 Hz4 804 Hz1 Hz4 804 Hz4 80 Hz4 Hz1 Hz4. 77 GHz FP32 Compute19.49 TFLOPs37.42 TFLOPs10.32 TFLOPs8.678 TFLOPs x431.24 TFLOPs4.5 TFLOPs FP64 Compute9,74 TFLOPs1.16 TFLOPs5.16 TFLOPs0,27 TFLOPs x40,97 TFLOPs0,14 TFLOPs FP16 Compte77.97 TFLOPs FP16 Compte77.97. 42 TFLOPs10.32 TFLOPs8.67 TFLOPs x431.24 TFLOPs4.5 TFLOPs INT8 Tensor Compute624 TOPS598.6 TOPs330 TOPSTBA500 TOPS36 TOPS TF32 Tensor Compute156 TFLOPS149.6 TOPs82 TFLOPSTBA125 TF9 TFLOPS PCIe InterconnectsNVLink 3
12 LinksPCIe 4,0 x16PCIe 4,0 x16 +
NVLink 3 (4 links) PCI e 4.0 x16PCIe 4.0 x16PCIe 4.0 x8 Capacidade de memória40 GB HBM2e48 GB GDDR624 GB HBM2e16 GB x4 GDDR624 GB GDDR616 GB GDDR6 Barramento de memória 5120 bit384 bit3072 bit128 bit x4384 bit128 bits Memória de banda 6,5 ​​MHz/TB1563 MHz Relógio 1295 MHz1.812 MHz5 MHz/TB1563 MHz1.563 MHz TB1563 MHz1. s933,1 GB/s231,9 GB/s x4600,2 GB/s200 GB/s TDP400W300W165W250W150W60W Form FactorSXM4PCIe slot duplo, slot duplo full LengthPCIe, slot dual full lengthPCIe, slot single full lengthPCIe, FLHHPCIe slot único, HLHF

Categories: IT Info