« comunicado de prensa »
NVIDIA anuncia la supercomputadora con IA DGX GH200
Nueva clase de supercomputadora con IA que conecta 256 superchips Grace Hopper en un enorme, 1-Exaflop, GPU de 144 TB para modelos gigantes que potencian la IA generativa, los sistemas de recomendación y el procesamiento de datos
COMPUTEX: NVIDIA anunció hoy una nueva clase de supercomputadora de IA de memoria grande: una NVIDIA DGX ™ con tecnología NVIDIA® GH200 Grace Hopper Superchips y NVIDIA NVLink® Switch System, creada para permitir el desarrollo de modelos gigantes de próxima generación para aplicaciones de lenguaje de IA generativa, sistemas de recomendación y cargas de trabajo de análisis de datos.
El espacio de memoria compartida masiva de NVIDIA DGX GH200 utiliza la tecnología de interconexión NVLink con el sistema de conmutación NVLink para combinar 256 superchips GH200, lo que les permite funcionar como una sola GPU. Esto proporciona 1 exaflop de rendimiento y 144 terabytes de memoria compartida, casi 500 veces más memoria que la generación anterior NVIDIA DGX A100, que se presentó en 2020.
“La IA generativa, los modelos de lenguaje grande y los sistemas de recomendación son los motores digitales de la economía moderna”, dijo Jensen Huang, fundador y director ejecutivo de NVIDIA.”Las supercomputadoras DGX GH200 AI integran las tecnologías de red y computación acelerada más avanzadas de NVIDIA para expandir la frontera de la IA”.
La tecnología NVIDIA NVLink expande la IA a escala
Los superchips GH200 eliminan la necesidad de una conexión PCIe de CPU a GPU tradicional mediante la combinación de una CPU NVIDIA Grace™ basada en Arm con una GPU NVIDIA H100 Tensor Core en el mismo paquete, utilizando interconexiones de chip NVIDIA NVLink-C2C. Esto aumenta el ancho de banda entre la GPU y la CPU en 7 veces en comparación con la última tecnología PCIe, reduce el consumo de energía de interconexión en más de 5 veces y proporciona un bloque de construcción de GPU de arquitectura Hopper de 600 GB para las supercomputadoras DGX GH200.
DGX GH200 es la primera supercomputadora en emparejar Grace Hopper Superchips con NVIDIA NVLink Switch System, una nueva interconexión que permite que todas las GPU en un sistema DGX GH200 funcionen juntas como una sola. El sistema de la generación anterior solo permitía combinar ocho GPU con NVLink como una GPU sin comprometer el rendimiento.
La arquitectura DGX GH200 proporciona 48 veces más ancho de banda de NVLink que la generación anterior, brindando el poder de una IA masiva superordenador con la sencillez de programar una sola GPU.
Una nueva herramienta de investigación para los pioneros de la IA
Google Cloud, Meta y Microsoft se encuentran entre los Primero se esperaba obtener acceso al DGX GH200 para explorar sus capacidades para cargas de trabajo generativas de IA. NVIDIA también tiene la intención de proporcionar el diseño DGX GH200 como modelo para los proveedores de servicios en la nube y otros hiperescaladores para que puedan personalizarlo aún más para su infraestructura.
“La creación de modelos generativos avanzados requiere enfoques innovadores para la infraestructura de IA”, dijo Mark Lohmeyer, vicepresidente de Cómputo en Google Cloud.”La nueva escala NVLink y la memoria compartida de Grace Hopper Superchips abordan los cuellos de botella clave en la IA a gran escala y esperamos explorar sus capacidades para Google Cloud y nuestras iniciativas de IA generativa”.
“A medida que crecen los modelos de IA más grandes, necesitan una infraestructura poderosa que pueda escalar para satisfacer las crecientes demandas”, dijo Alexis Björlin, vicepresidente de infraestructura, sistemas de inteligencia artificial y plataformas aceleradas de Meta.”El diseño Grace Hopper de NVIDIA busca proporcionar a los investigadores la capacidad de explorar nuevos enfoques para resolver sus mayores desafíos”.
“Entrenar grandes modelos de IA es tradicionalmente una tarea que requiere muchos recursos y tiempo”, dijo Girish Bablani. , vicepresidente corporativo de Azure Infrastructure en Microsoft.”El potencial de DGX GH200 para trabajar con conjuntos de datos del tamaño de un terabyte permitiría a los desarrolladores realizar investigaciones avanzadas a mayor escala y velocidades aceleradas”.
Nueva supercomputadora NVIDIA Helios para promover la investigación y el desarrollo
NVIDIA es construyendo su propia supercomputadora de IA basada en DGX GH200 para potenciar el trabajo de sus investigadores y equipos de desarrollo.
Nombrada NVIDIA Helios, la supercomputadora contará con cuatro sistemas DGX GH200. Cada uno estará interconectado con la red NVIDIA Quantum-2 InfiniBand para impulsar el rendimiento de datos para entrenar grandes modelos de IA. Helios incluirá 1024 Superchips Grace Hopper y se espera que esté en línea a finales de año.
Totalmente integrado y diseñado específicamente para modelos gigantes
Las supercomputadoras DGX GH200 incluyen Software de NVIDIA para proporcionar una solución completa lista para usar para las cargas de trabajo de análisis de datos y IA más grandes. El software NVIDIA Base Command™ proporciona gestión de flujos de trabajo de IA, gestión de clústeres de nivel empresarial, bibliotecas que aceleran la infraestructura informática, de almacenamiento y de red, y software de sistema optimizado para ejecutar cargas de trabajo de IA.
También se incluye NVIDIA AI Enterprise, el capa de software de la plataforma NVIDIA AI. Proporciona más de 100 marcos, modelos preentrenados y herramientas de desarrollo para agilizar el desarrollo y la implementación de la IA de producción, incluida la IA generativa, la visión por computadora, la IA del habla y más.
Disponibilidad
NVIDIA Se espera que las supercomputadoras DGX GH200 estén disponibles a finales de año.
« fin del comunicado de prensa »