« press release »


NVIDIA Mengumumkan DGX GH200 AI Supercomputer

Kelas Baru AI Supercomputer Menghubungkan 256 Grace Hopper Superchips ke dalam Massive, 1-Exaflop, GPU 144 TB untuk Model Raksasa yang Mendukung AI Generatif, Sistem Rekomendasi, Pemrosesan Data

COMPUTEX—NVIDIA hari ini mengumumkan kelas baru superkomputer AI dengan memori besar — ​​NVIDIA DGX ™ superkomputer yang ditenagai oleh NVIDIA® GH200 Grace Hopper Superchips dan NVIDIA NVLink® Switch System — dibuat untuk memungkinkan pengembangan model raksasa generasi mendatang untuk aplikasi bahasa AI generatif, sistem rekomendasi, dan beban kerja analitik data.

Ruang memori bersama NVIDIA DGX GH200 yang sangat besar menggunakan teknologi interkoneksi NVLink dengan NVLink Switch System untuk menggabungkan 256 superchip GH200, yang memungkinkannya bekerja sebagai GPU tunggal. Hal ini memberikan performa 1 exaflop dan memori bersama 144 terabyte — hampir 500x lebih banyak memori dibandingkan NVIDIA DGX A100 generasi sebelumnya, yang diperkenalkan pada tahun 2020.

“Generative AI, model bahasa besar, dan sistem pemberi rekomendasi adalah mesin digital ekonomi modern,” kata Jensen Huang, pendiri dan CEO NVIDIA. “Superkomputer DGX GH200 AI mengintegrasikan teknologi komputasi terakselerasi dan jaringan tercanggih NVIDIA untuk memperluas batas AI.”

Teknologi NVIDIA NVLink Memperluas Skala AI
Superchip GH200 meniadakan membutuhkan koneksi PCIe CPU-ke-GPU tradisional dengan menggabungkan CPU NVIDIA Grace™ berbasis Arm dengan GPU NVIDIA H100 Tensor Core dalam paket yang sama, menggunakan interkoneksi chip NVIDIA NVLink-C2C. Hal ini meningkatkan bandwidth antara GPU dan CPU sebesar 7x dibandingkan dengan teknologi PCIe terbaru, memangkas konsumsi daya interkoneksi lebih dari 5x, dan menyediakan blok penyusun GPU arsitektur Hopper sebesar 600 GB untuk superkomputer DGX GH200.

DGX GH200 adalah superkomputer pertama yang memasangkan Grace Hopper Superchips dengan NVIDIA NVLink Switch System, interkoneksi baru yang memungkinkan semua GPU dalam sistem DGX GH200 bekerja bersama sebagai satu kesatuan. Sistem generasi sebelumnya hanya menyediakan delapan GPU untuk digabungkan dengan NVLink sebagai satu GPU tanpa mengurangi performa.

Arsitektur DGX GH200 menyediakan bandwidth NVLink 48x lebih banyak daripada generasi sebelumnya, menghadirkan kekuatan AI yang masif superkomputer dengan kemudahan memprogram satu GPU.

Alat Riset Baru untuk Perintis AI
Google Cloud, Meta, dan Microsoft adalah beberapa di antaranya pertama diharapkan untuk mendapatkan akses ke DGX GH200 untuk mengeksplorasi kemampuannya untuk beban kerja AI generatif. NVIDIA juga bermaksud menyediakan desain DGX GH200 sebagai cetak biru bagi penyedia layanan cloud dan hyperscaler lainnya sehingga mereka dapat menyesuaikannya lebih lanjut untuk infrastruktur mereka.

“Membangun model generatif lanjutan memerlukan pendekatan inovatif untuk infrastruktur AI,” kata Mark Lohmeyer, wakil presiden Compute di Google Cloud. “Skala NVLink baru dan memori bersama dari Grace Hopper Superchips mengatasi hambatan utama dalam AI skala besar dan kami berharap dapat mengeksplorasi kemampuannya untuk Google Cloud dan inisiatif AI generatif kami.”

“Seiring pertumbuhan model AI lebih besar, mereka membutuhkan infrastruktur yang kuat yang dapat diskalakan untuk memenuhi permintaan yang meningkat,” kata Alexis Björlin, wakil presiden Infrastruktur, Sistem AI, dan Platform yang Dipercepat di Meta. “Desain Grace Hopper NVIDIA tampaknya memberi para peneliti kemampuan untuk mengeksplorasi pendekatan baru untuk memecahkan tantangan terbesar mereka.”

“Melatih model AI besar secara tradisional merupakan tugas intensif sumber daya dan waktu,” kata Girish Bablani , wakil presiden korporat Azure Infrastructure di Microsoft. “Potensi DGX GH200 untuk bekerja dengan kumpulan data berukuran terabyte akan memungkinkan pengembang untuk melakukan penelitian lanjutan dalam skala yang lebih besar dan kecepatan yang dipercepat.”

Superkomputer NVIDIA Helios Baru untuk Memajukan Penelitian dan Pengembangan
NVIDIA adalah membangun superkomputer AI berbasis DGX GH200 miliknya sendiri untuk mendukung pekerjaan para peneliti dan tim pengembangannya.

Dinamakan NVIDIA Helios, superkomputer ini akan menampilkan empat sistem DGX GH200. Masing-masing akan saling terhubung dengan jaringan NVIDIA Quantum-2 InfiniBand untuk meningkatkan throughput data untuk melatih model AI berukuran besar. Helios akan dilengkapi dengan 1.024 Grace Hopper Superchips dan diharapkan akan online pada akhir tahun ini.

Terintegrasi Penuh dan Dibangun Khusus untuk Model Raksasa
Superkomputer DGX GH200 termasuk Perangkat lunak NVIDIA untuk memberikan solusi turnkey, full-stack untuk AI terbesar dan beban kerja analitik data. Perangkat lunak NVIDIA Base Command™ menyediakan manajemen alur kerja AI, manajemen klaster tingkat perusahaan, pustaka yang mempercepat komputasi, penyimpanan, dan infrastruktur jaringan, serta perangkat lunak sistem yang dioptimalkan untuk menjalankan beban kerja AI.

Termasuk juga NVIDIA AI Enterprise, perangkat lunak lapisan perangkat lunak platform NVIDIA AI. Ini menyediakan lebih dari 100 kerangka kerja, model yang telah dilatih sebelumnya, dan alat pengembangan untuk merampingkan pengembangan dan penerapan AI produksi termasuk AI generatif, visi komputer, AI ucapan, dan lainnya.

Ketersediaan
NVIDIA Superkomputer DGX GH200 diharapkan akan tersedia pada akhir tahun ini.


« akhir siaran pers »

Categories: IT Info