NVIDIA A2 es un acelerador de bajo consumo para IA
Hoy NVIDIA lanza su acelerador de interferencia de borde de nivel de entrada.
NVIDIA continúa agregando más SKU a su línea de Data Center Ampere. La serie que solíamos llamar”Tesla”ahora usa un nombre mucho más simple, aunque mucho más confuso. El A2 Tensor Core es el acelerador de nivel de entrada que cuenta con una GPU de 8nm Ampere GA107 con 1280 CUDA Cores, la mitad de lo que ofrece el procesador en una versión completa.
El A2 tiene mucho en común con el A16 , que se basa en cuatro GPU GA107. Ambos aceleradores tienen memoria GDDR6 de 16 GB en la interfaz de 128 bits, excepto para cada GPU. Dicho esto, el A16 ofrece 64 GB de memoria, pero también consume mucha más energía: 250 W. El A2, por otro lado, es una solución muy eficiente en el consumo de energía con TBP a 60W como máximo, pero la GPU también se puede configurar en 40W. Por lo tanto, no requiere alimentación externa.
Con un reloj base de 1440 MHz y un reloj de impulso de 1770 MHz, la GPU ofrece hasta 4.5 TFLOPS de potencia de cómputo de precisión simple. En realidad, esto es incluso menos que el móvil NVIDIA GeForce RTX 3050 Ti con 7.1 TFLOP, pero la GPU para juegos tiene 2048 núcleos CUDA.
Especificaciones del núcleo de NVIDIA A2 Tensor, fuente: NVIDIA
El acelerador se está comparando con el Turing T4 de nivel de entrada, que era el acelerador más lento de la generación anterior. Según NVIDIA, será de un 20 a un 30% más rápido que T4 en casos de uso de borde inteligente. También ofrece un 60% más de relación precio/rendimiento y un 10% más de eficiencia energética en comparación con el T4.
El A2 es un acelerador sin cabeza que no se puede utilizar para juegos a menos que se utilice a través de un entorno de máquina virtual. Está optimizado para cargas de trabajo de inferencia de IA. Está destinado a ser una GPU de servidor rentable y altamente compatible gracias a su diseño pasivo y de una sola ranura. NVIDIA no revela públicamente el precio de su GPU de servidor, como el A2, pero la compañía confirmó que ahora está disponible para socios OEM. Fuente: NVIDIA a través de AnandTech
2 decodificadores de vídeo (incluye decodificación AV1) Memoria de GPU GPU GDDR6 de 16 GB ancho de banda de memoria 200 GB/s Interconexión PCIe Gen4 x8 Factor de forma PCIe de perfil bajo de 1 ranura Potencia máxima de diseño térmico (TDP) 40-60W (configurable) Soporte de software de GPU virtual (vGPU )² NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Servidor (vCS)
NVIDIA Ampere Data Center GPUsVideoCardz.comGPUCUDA/TensorMemoryFP32 ComputeTDPNVIDIA A100GA100-884/8836912/43240/80GB HBM2e 5120b 1,94 TB/s 19,5 TFLOPS400W/250WNVIDIA A40GA102-89510752/67248GB G6 384b 696 GB/s37,4 TFLOPS300WNVIDIA A30GA100-8903584/22424GB HBM2e 3072b 933 GB/s10,3 TFLOPS-A165?WN GA/1604x 16GB G6 128b 200 GB/s 18 TFLOPS250W NVIDIA A2 GA107-??? 1280/40 16GB G6 128b 200GB/s 4.5 TFLOPS 40-60W