« siaran akhbar »
NVIDIA Mengumumkan DGX GH200 AI Supercomputer
Kelas Baharu AI Supercomputer Menghubungkan 256 Grace Hopper Superchips Kepada Besar-besaran, 1-Exaflop, GPU 144TB untuk Model Gergasi Menjana AI Generatif, Sistem Pengesyoran, Pemprosesan Data
COMPUTEX—NVIDIA hari ini mengumumkan kelas baru superkomputer AI memori besar — NVIDIA DGX Superkomputer ™ yang dikuasakan oleh NVIDIA® GH200 Grace Hopper Superchips dan Sistem Suis NVIDIA NVLink® — dicipta untuk membolehkan pembangunan model gergasi generasi akan datang untuk aplikasi bahasa AI generatif, sistem pengesyor dan beban kerja analitik data.
Ruang memori kongsi besar NVIDIA DGX GH200 menggunakan teknologi interkoneksi NVLink dengan Sistem Suis NVLink untuk menggabungkan 256 cip super GH200, membolehkannya berfungsi sebagai GPU tunggal. Ini menyediakan 1 exaflop prestasi dan 144 terabait memori dikongsi — hampir 500x lebih banyak memori daripada generasi sebelumnya NVIDIA DGX A100, yang diperkenalkan pada tahun 2020.
“AI Generatif, model bahasa besar dan sistem pengesyor ialah enjin digital ekonomi moden,” kata Jensen Huang, pengasas dan Ketua Pegawai Eksekutif NVIDIA. “Superkomputer AI DGX GH200 menyepadukan teknologi pengkomputeran dan perangkaian tercanggih NVIDIA untuk meluaskan sempadan AI.”
Teknologi NVIDIA NVLink Mengembangkan AI pada Skala
cip super GH200 menghapuskan memerlukan sambungan PCIe CPU-ke-GPU tradisional dengan menggabungkan CPU NVIDIA Grace™ berasaskan Arm dengan GPU Tensor Core NVIDIA H100 dalam pakej yang sama, menggunakan sambungan cip NVIDIA NVLink-C2C. Ini meningkatkan lebar jalur antara GPU dan CPU sebanyak 7x berbanding dengan teknologi PCIe terkini, mengurangkan penggunaan kuasa antara sambungan lebih daripada 5x dan menyediakan blok binaan GPU seni bina Hopper 600GB untuk superkomputer DGX GH200.
DGX GH200 ialah superkomputer pertama yang menggandingkan Grace Hopper Superchips dengan NVIDIA NVLink Switch System, satu sambungan baharu yang membolehkan semua GPU dalam sistem DGX GH200 berfungsi bersama sebagai satu. Sistem generasi sebelumnya hanya menyediakan lapan GPU untuk digabungkan dengan NVLink sebagai satu GPU tanpa menjejaskan prestasi.
Seni bina DGX GH200 menyediakan lebar jalur NVLink 48x ganda berbanding generasi sebelumnya, memberikan kuasa AI yang besar superkomputer dengan kesederhanaan pengaturcaraan GPU tunggal.
Alat Penyelidikan Baharu untuk AI Pioneers
Google Cloud, Meta dan Microsoft adalah antara pertama dijangka mendapat akses kepada DGX GH200 untuk meneroka keupayaannya untuk beban kerja AI generatif. NVIDIA juga berhasrat untuk menyediakan reka bentuk DGX GH200 sebagai pelan tindakan kepada penyedia perkhidmatan awan dan hyperscaler lain supaya mereka boleh menyesuaikannya lagi untuk infrastruktur mereka.
“Membina model generatif lanjutan memerlukan pendekatan inovatif kepada infrastruktur AI,” kata Mark Lohmeyer, naib presiden Compute di Google Cloud. “Skala NVLink baharu dan memori perkongsian Grace Hopper Superchips menangani kesesakan utama dalam AI berskala besar dan kami tidak sabar untuk menerokai keupayaannya untuk Google Cloud dan inisiatif AI generatif kami.”
“Apabila model AI berkembang lebih besar, mereka memerlukan infrastruktur berkuasa yang boleh berskala untuk memenuhi permintaan yang semakin meningkat,” kata Alexis Björlin, naib presiden Infrastruktur, Sistem AI dan Platform Dipercepatkan di Meta. “Reka bentuk Grace Hopper NVIDIA kelihatan untuk menyediakan penyelidik dengan keupayaan untuk meneroka pendekatan baharu untuk menyelesaikan cabaran terbesar mereka.”
“Melatih model AI besar secara tradisinya merupakan tugas yang memerlukan sumber dan masa yang intensif,” kata Girish Bablani , naib presiden korporat Azure Infrastructure di Microsoft. “Potensi untuk DGX GH200 berfungsi dengan set data bersaiz terabait akan membolehkan pembangun menjalankan penyelidikan lanjutan pada skala yang lebih besar dan kelajuan dipercepatkan.”
Komputer Super NVIDIA Helios baharu untuk Memajukan Penyelidikan dan Pembangunan
NVIDIA ialah membina superkomputer AI berasaskan DGX GH200 sendiri untuk menggerakkan kerja penyelidik dan pasukan pembangunannya.
Dinamakan NVIDIA Helios, superkomputer itu akan menampilkan empat sistem DGX GH200. Setiap satu akan disambungkan dengan rangkaian NVIDIA Quantum-2 InfiniBand untuk mengecas daya pemprosesan data untuk melatih model AI yang besar. Helios akan menyertakan 1,024 Grace Hopper Superchips dan dijangka akan muncul dalam talian menjelang akhir tahun ini.
Bersepadu Sepenuhnya dan Dibina Tujuan untuk Model Gergasi
Superkomputer DGX GH200 termasuk Perisian NVIDIA untuk menyediakan penyelesaian timbunan penuh untuk AI terbesar dan beban kerja analitik data. Perisian NVIDIA Base Command™ menyediakan pengurusan aliran kerja AI, pengurusan kluster gred perusahaan, perpustakaan yang mempercepatkan pengiraan, storan dan infrastruktur rangkaian serta perisian sistem yang dioptimumkan untuk menjalankan beban kerja AI.
Turut disertakan ialah NVIDIA AI Enterprise, lapisan perisian platform AI NVIDIA. Ia menyediakan lebih 100 rangka kerja, model terlatih dan alatan pembangunan untuk menyelaraskan pembangunan dan penggunaan AI pengeluaran termasuk AI generatif, penglihatan komputer, AI pertuturan dan banyak lagi.
Ketersediaan
NVIDIA Superkomputer DGX GH200 dijangka tersedia menjelang akhir tahun ini.
« akhir siaran akhbar »