Az NVIDIA nemrégiben bejelentett, Hopper GPU-architektúrára épülő H100 80 GB-os PCIe-gyorsítója eladásra került Japánban. Ez a második gyorsító, amely árával együtt szerepel a japán piacon, az első az AMD MI210 PCIe, amelyet szintén alig néhány napja jegyeztek.

NVIDIA H100 80 GB-os PCIe gyorsító A Hopper GPU őrült, 30 000 USD-t meghaladó áron kerül a listára Japánban

A H100 SXM5 konfigurációval ellentétben a H100 PCIe csökkentett specifikációkat kínál, és 114 SM-et tartalmaz a GPU és a GH100 teljes 144 SM-jéből. 132 SMS a H100 SXM-en. A chip önmagában 3200 FP8, 1600 TF16, 800 FP32 és 48 TFLOP FP64 számítási lóerőt kínál. 456 tenzor-és textúraegységgel is rendelkezik.

Az NVIDIA bemutatja a Hopper GH100 Powered DGX H100, DGX Pod H100, H100 PCIe gyorsítókat

Az alacsonyabb számítási csúcsteljesítménye miatt a H100 PCIe alacsonyabb órajelekkel működik, és mint ilyen, 350 W-os TDP-vel rendelkezik, szemben az SXM5 változat dupla 700 W-os TDP-jével. A PCIe kártya azonban megtartja 80 GB-os memóriáját, amely egy 5120 bites busz interfészen található, de HBM2e változatban (>2 TB/s sávszélesség).

Az gdm-or-jp/a>, egy japán forgalmazó cég, gdep-co-jp listázta az NVIDIA H100 80 GB-os PCIe gyorsítót, amelynek ára 4 313 000 £ (33 120 USD) és összköltsége 4 745 950 ¥ forgalmi adóval, amely 36 445 USD-ra vált át.. A gyorsító várhatóan 2022 második felében érkezik, és a szabványos, kétnyílásos, passzív hűtésű változatban érkezik. Azt is közölték, hogy a forgalmazó ingyenes NVLINK-hidakat biztosít azoknak, akik több kártyát vásárolnak, de esetleg később szállítják.

Most az AMD Instinct MI210-hez képest, amely ugyanazon a piacon körülbelül 16 500 dollárba kerül, az NVIDIA H100 több mint kétszerese a költségnek. Az NVIDIA-kínálat valóban magas GPU-teljesítményt nyújt az 50 W-os AMD HPC-gyorsítóhoz képest. A H100 nem tenzoros FP32 TFLOP-jai 48 TFLOP-ra vannak besorolva, míg az MI210 FP32 maximális névleges számítási teljesítménye 45,3 TFLOP. A Sparity és Tensor műveletekkel a H100 akár 800 TFLOP FP32 lóerőt is képes leadni. A H100 nagyobb 80 GB-os memóriakapacitást is kínál, mint az MI210 64 GB-os. A kinézetből az NVIDIA felárat fizet magasabb AI/ML képességeiért.

NVIDIA Ampere GA100 GPU-alapú Tesla A100 Specifikációk:

NVIDIA Tesla grafikus kártyaNVIDIA H100 (SMX5) NVIDIA H100 (PCIe)NVIDIA A100 (SXM4)NVIDIA A100 (PCIe4)Tesla V100S (PCIe)Tesla V100 (SXM2)Tesla P100 (SXM2)Tesla P100
(PCI-Express)M(PCI-Express)(PCI-Express) GPUGH100 (Hopper)GH100 (Hopper)GA100 (Amper)GA100 (Amper)GV100 (Volta)GV100 (Volta)GP100 (Pascal)GP100 (Pascal)GMKler)GM10well200 Process Node4nm4nm7nm7nm12nm12nm16nm16nm28nm28nm Transistors80 Billion80 Billion54.2 Billion54.2 Billion21.1 Billion21.1 Billion15.3 Billion15.3 Billion8 Billion7.1 milliárd GPU Die Size814mm2814mm2826mm2826mm2815mm2815mm2610 mm2610 mm2601 mm2551 mm2 SMs132114108108808056562415 TPCs66575454404028282415 FP32 CUDA maggal SM128128646464646464128192 FP64 CUDA magok/SM128128323232323232464 FP32 CUDA Cores168961459269126912512051203584358430722880 FP64 CUDA magok 16 8961459234563456256025601792179296960 Tensor Cores528456432432640640N/AN/AN/AN/A Texture Units528456432432320320224224192240 kiemelés ClockTBDTBD1410 MHz1410 MHz1601 MHz1530 MHz1480 MHz1329MHz1114 MHz875 MHz felsők (DNN/AI) 2000 tetejét
4000 TOPs1600 felsők
3200 TOPs1248 felsők
2496 tetejét Sparsity1248 felsők
2496 TOP és Sparsity130 TOP125 TOPN/AN/AN/AN/A FP16 Compute2000 TFLOPs1600 TFLOPs312 TFLOP
624 TFLOP Sparity312 TFLOP-val
624 TFLOPs.0 TFLOPs.84 Sparsitys. AN/A FP32 Compute1000 TFLOPs800 TFLOPs156 TFLOPs
(19,5 TFLOPs standard)156 TFLOPs
(19,5 TFLOPs standard)16,4 TFLOPs15,7 TFLOPs TFLOPs10.6 TFLOP8 TFLOPs.
(9,7 TFLOP szabvány)19,5 TFLOP
(9,7 TFLOP szabvány)8,2 TFLOPs7,80 TFLOPs5,30 TFLOPs4,7 TFLOPs0,2 TFLOPs1,68 TFLOPs Memória interfész5120 bites HBM-bit HBM351Me-4B16bit HBM3514206 bit HBM24096 bites HBM24096 bites HBM24096 bites HBM2384 bites GDDR5384-bites GDDR5 memóriaméret Akár 80 GB HBM3 @ 3,0 Gbps Akár 80 GB HBM2e @ 2,0 Gbps Akár 40 GB HBM2 @ 1,6 TB/s
Akár 80 GB HBM2 @ 1,6 TB/sUp-2,0 TB/sUp 6/sUp
Akár 80 GB HBM2 @ 2,0 TB/s16 GB HBM2 @ 1134 GB/s16 GB HBM2 @ 900 GB/s16 GB HBM2 @ 732 GB/s16 GB HBM2 @ 732 GB/s
12 GB HBM2 @ 549 GB/S24 GB GDDR5 @ 288 GB/s12 GB GDDR5 @ 288 GB/s L2 gyorsítótár Size51200 KB51200 KB40960 KB40960 KB6144 KB6144 KB4096 KB4096 KB3072 KB1536 KB TDP700W350W400W250W250W300W300W250W250W235W

Categories: IT Info