Les nouveaux supercalculateurs Compute Engine A3 de Google Cloud sont conçus pour les modèles d’intelligence artificielle (IA) et d’apprentissage automatique (ML) les plus exigeants, associant les GPU NVIDIA H100 Tensor Core aux avancées réseau de Google.
Par rapport aux VM A2 de la société, Google revendique jusqu’à 10 fois plus de bande passante réseau avec de faibles latences et une stabilité améliorée. Comment y est-il parvenu ? Les nouveaux supercalculateurs A3 utilisant les GPU NVIDIA H100 sont les premiers à utiliser les IPU 200 Gbit/s conçus sur mesure par Google avec des données GPU contournant l’hôte CPU sur une interface distincte par rapport aux autres réseaux de VM et au trafic de données.
Comme pour tous l’évolutivité, basée sur le supercalcul et l’IA de pointe, permet à des dizaines de milliers de GPU interconnectés de fonctionner avec une”bande passante de charge de travail qui ne se distingue pas des tissus de réseau non bloquants plus chers et prêts à l’emploi”.
Des trucs impressionnants. Voici une ventilation des fonctionnalités des nouveaux supercalculateurs A3 de Google.
8 GPU H100 utilisant l’architecture Hopper de NVIDIA, offrant un débit de calcul 3x 3,6 To/s de bande passante bisectionnelle entre les 8 GPU d’A3 via NVIDIA NVSwitch et NVLink 4.0 4ème génération de nouvelle génération Processeurs Intel Xeon Scalable de génération 2 To de mémoire hôte via des modules DIMM DDR5 à 4 800 MHz Bande passante réseau 10 fois supérieure, alimentée par nos IPU compatibles avec le matériel, une pile de communication GPU inter-serveurs spécialisée et des optimisations NCCL
Cette annonce renforce également le partenariat entre Google et NVIDIA concernant l’IA et l’informatique basée sur le cloud.
“Les machines virtuelles A3 de Google Cloud, optimisées par les GPU NVIDIA H100 de nouvelle génération, accéléreront la formation et le service des applications d’IA génératives”, a déclaré Ian Buck, vice-président d’hyperscale et le calcul haute performance chez NVIDIA.”Dans la foulée des instances G2 récemment lancées par Google Cloud, nous sommes fiers de poursuivre notre collaboration avec Google Cloud pour aider à transformer les entreprises du monde entier grâce à une infrastructure d’IA spécialement conçue.”