NVIDIA A2 é um acelerador de baixa potência para AI

Hoje a NVIDIA lança seu acelerador de interferência de borda de nível básico.

A NVIDIA continua adicionando mais SKUs à sua linha de Amperes para data centers. As séries que chamávamos de “Tesla” agora usam uma nomenclatura muito mais simples, embora muito mais confusa. O A2 Tensor Core é o acelerador básico com GPU Ampere GA107 de 8 nm com 1280 núcleos CUDA, metade do que o processador oferece em uma versão full-fat.

O A2 tem muito em comum com o A16 , que é baseado em quatro GPUs GA107. Ambos os aceleradores têm memória GDDR6 de 16 GB na interface de 128 bits, exceto para cada GPU. Dito isso, o A16 oferece 64 GB de memória, mas também consome muito mais energia: 250W. O A2, por outro lado, é uma solução muito eficiente em termos de energia com TBP em 60W no máximo, mas a GPU também pode ser configurada para 40W. Portanto, não requer alimentação externa.

Com um clock base de 1440 MHz e um clock de reforço de 1770 MHz, a GPU oferece até 4,5 TFLOPS de potência de computação de precisão simples. Na verdade, isso é ainda menos do que NVIDIA GeForce RTX 3050 Ti para dispositivos móveis com 7.1 TFLOPs, mas a GPU para jogos tem 2.048 núcleos CUDA.

Especificações do núcleo do tensor NVIDIA A2, Fonte: NVIDIA

O acelerador está sendo comparado ao Turing T4 básico, que era o acelerador mais lento da geração anterior. De acordo com a NVIDIA, será de 20 a 30% mais rápido que o T4 em casos de uso de borda inteligente. Também oferece 60% melhor preço para desempenho e 10% melhor eficiência de energia em comparação com o T4.

NVIDIA A2 Tensor Core VideoCardz Desempenho Peak FP32 4.5 TF Núcleo do tensor TF32 9 TF | 18 TF¹ BFLOAT16 Tensor Core 18 TF | 36 TF¹ Núcleo do tensor FP16 de pico 18 TF | 36 TF¹ Núcleo do tensor INT8 de pico 36 TOPS | 72 TOPS¹ Peak INT4 Tensor Core 72 TOPS | 144 TOPS¹ RT Cores 10 Mecanismos de mídia 1 codificador de vídeo
2 decodificadores de vídeo (inclui decodificação AV1) Memória GPU 16GB GDDR6 GPU largura de banda de memória 200 GB/s Interconexão PCIe Gen4 x8 Fator de forma 1 slot, PCIe de perfil baixo Potência máxima de design térmico (TDP) 40–60 W (configurável) Suporte a software GPU virtual (vGPU )² NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Servidor (vCS)

O A2 é um acelerador sem comando que não pode ser usado para jogos, a menos que seja usado em um ambiente de máquina virtual. Ele é otimizado para cargas de trabalho de inferência de IA. Ele foi projetado para ser uma GPU de servidor econômica e altamente compatível, graças ao seu design passivo e de slot único. A NVIDIA não revela publicamente os preços de sua GPU de servidor, como a A2, mas a empresa confirmou que agora está disponível para parceiros OEM.

NVIDIA Ampere Data Center GPUsVideoCardz.comGPUCUDA/TensorMemoryFP32 ComputeTDPNVIDIA A100GA100-884/8836912/43240/80GB HBM2e 5120b 1,94 TB/s19,5 TFLOPS400W/250WNVIDIA A40GA102-89510752/67248GB G6 384b 696 GB/s37,4 TFLOPS300WNVIDIA A30GA100-8903584/22424GB HBM2e 3072b 933 GB/s10,310 TF165 TF16510.310 TF165 AWNVIDIA A30GA100-8903584/22424GB HBM2e ???/1604x 16 GB G6 128b 200 GB/s18 TFLOPS250W NVIDIA A2 GA107-??? 1280/40 16 GB G6 128b 200 GB/s 4.5 TFLOPS 40-60W

Fonte: NVIDIA via AnandTech

Categories: IT Info