NVIDIA A2 es un acelerador de bajo consumo para IA

Hoy NVIDIA lanza su acelerador de interferencia de borde de nivel de entrada.

NVIDIA continúa agregando más SKU a su línea de Data Center Ampere. La serie que solíamos llamar”Tesla”ahora usa un nombre mucho más simple, aunque mucho más confuso. El A2 Tensor Core es el acelerador de nivel de entrada que cuenta con una GPU de 8nm Ampere GA107 con 1280 CUDA Cores, la mitad de lo que ofrece el procesador en una versión completa.

El A2 tiene mucho en común con el A16 , que se basa en cuatro GPU GA107. Ambos aceleradores tienen memoria GDDR6 de 16 GB en la interfaz de 128 bits, excepto para cada GPU. Dicho esto, el A16 ofrece 64 GB de memoria, pero también consume mucha más energía: 250 W. El A2, por otro lado, es una solución muy eficiente en el consumo de energía con TBP a 60W como máximo, pero la GPU también se puede configurar en 40W. Por lo tanto, no requiere alimentación externa.

Con un reloj base de 1440 MHz y un reloj de impulso de 1770 MHz, la GPU ofrece hasta 4.5 TFLOPS de potencia de cómputo de precisión simple. En realidad, esto es incluso menos que el móvil NVIDIA GeForce RTX 3050 Ti con 7.1 TFLOP, pero la GPU para juegos tiene 2048 núcleos CUDA.

Especificaciones del núcleo de NVIDIA A2 Tensor, fuente: NVIDIA

El acelerador se está comparando con el Turing T4 de nivel de entrada, que era el acelerador más lento de la generación anterior. Según NVIDIA, será de un 20 a un 30% más rápido que T4 en casos de uso de borde inteligente. También ofrece un 60% más de relación precio/rendimiento y un 10% más de eficiencia energética en comparación con el T4.

NVIDIA A2 Tensor Core VideoCardz Rendimiento Peak FP32 4.5 TF TF32 Tensor Core 9 TF | 18 TF¹ BFLOAT16 Tensor Core 18 TF | 36 TF¹ Peak FP16 Tensor Core 18 TF | 36 TF¹ Peak INT8 Tensor Core 36 TOPS | 72 TOPS¹ Peak INT4 Tensor Core 72 TOPS | 144 TOPS¹ RT Cores 10 Motores de medios 1 codificador de vídeo
2 decodificadores de vídeo (incluye decodificación AV1) Memoria de GPU GPU GDDR6 de 16 GB ancho de banda de memoria 200 GB/s Interconexión PCIe Gen4 x8 Factor de forma PCIe de perfil bajo de 1 ranura Potencia máxima de diseño térmico (TDP) 40-60W (configurable) Soporte de software de GPU virtual (vGPU )² NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Servidor (vCS)

El A2 es un acelerador sin cabeza que no se puede utilizar para juegos a menos que se utilice a través de un entorno de máquina virtual. Está optimizado para cargas de trabajo de inferencia de IA. Está destinado a ser una GPU de servidor rentable y altamente compatible gracias a su diseño pasivo y de una sola ranura. NVIDIA no revela públicamente el precio de su GPU de servidor, como el A2, pero la compañía confirmó que ahora está disponible para socios OEM.

NVIDIA Ampere Data Center GPUsVideoCardz.comGPUCUDA/TensorMemoryFP32 ComputeTDPNVIDIA A100GA100-884/8836912/43240/80GB HBM2e 5120b 1,94 TB/s 19,5 TFLOPS400W/250WNVIDIA A40GA102-89510752/67248GB G6 384b 696 GB/s37,4 TFLOPS300WNVIDIA A30GA100-8903584/22424GB HBM2e 3072b 933 GB/s10,3 TFLOPS-A165?WN GA/1604x 16GB G6 128b 200 GB/s 18 TFLOPS250W NVIDIA A2 GA107-??? 1280/40 16GB G6 128b 200GB/s 4.5 TFLOPS 40-60W

Fuente: NVIDIA a través de AnandTech

Categories: IT Info