Az NVIDIA nemrégiben bejelentett, Hopper GPU-architektúrára épülő H100 80 GB-os PCIe-gyorsítója eladásra került Japánban. Ez a második gyorsító, amely árával együtt szerepel a japán piacon, az első az AMD MI210 PCIe, amelyet szintén alig néhány napja jegyeztek.
NVIDIA H100 80 GB-os PCIe gyorsító A Hopper GPU őrült, 30 000 USD-t meghaladó áron kerül a listára Japánban
A H100 SXM5 konfigurációval ellentétben a H100 PCIe csökkentett specifikációkat kínál, és 114 SM-et tartalmaz a GPU és a GH100 teljes 144 SM-jéből. 132 SMS a H100 SXM-en. A chip önmagában 3200 FP8, 1600 TF16, 800 FP32 és 48 TFLOP FP64 számítási lóerőt kínál. 456 tenzor-és textúraegységgel is rendelkezik.
Az NVIDIA bemutatja a Hopper GH100 Powered DGX H100, DGX Pod H100, H100 PCIe gyorsítókat
Az alacsonyabb számítási csúcsteljesítménye miatt a H100 PCIe alacsonyabb órajelekkel működik, és mint ilyen, 350 W-os TDP-vel rendelkezik, szemben az SXM5 változat dupla 700 W-os TDP-jével. A PCIe kártya azonban megtartja 80 GB-os memóriáját, amely egy 5120 bites busz interfészen található, de HBM2e változatban (>2 TB/s sávszélesség).
Az gdm-or-jp/a>, egy japán forgalmazó cég, gdep-co-jp listázta az NVIDIA H100 80 GB-os PCIe gyorsítót, amelynek ára 4 313 000 £ (33 120 USD) és összköltsége 4 745 950 ¥ forgalmi adóval, amely 36 445 USD-ra vált át.. A gyorsító várhatóan 2022 második felében érkezik, és a szabványos, kétnyílásos, passzív hűtésű változatban érkezik. Azt is közölték, hogy a forgalmazó ingyenes NVLINK-hidakat biztosít azoknak, akik több kártyát vásárolnak, de esetleg később szállítják.
Most az AMD Instinct MI210-hez képest, amely ugyanazon a piacon körülbelül 16 500 dollárba kerül, az NVIDIA H100 több mint kétszerese a költségnek. Az NVIDIA-kínálat valóban magas GPU-teljesítményt nyújt az 50 W-os AMD HPC-gyorsítóhoz képest. A H100 nem tenzoros FP32 TFLOP-jai 48 TFLOP-ra vannak besorolva, míg az MI210 FP32 maximális névleges számítási teljesítménye 45,3 TFLOP. A Sparity és Tensor műveletekkel a H100 akár 800 TFLOP FP32 lóerőt is képes leadni. A H100 nagyobb 80 GB-os memóriakapacitást is kínál, mint az MI210 64 GB-os. A kinézetből az NVIDIA felárat fizet magasabb AI/ML képességeiért.
NVIDIA Ampere GA100 GPU-alapú Tesla A100 Specifikációk:
(PCI-Express)M(PCI-Express)
4000 TOPs1600 felsők
3200 TOPs1248 felsők
2496 tetejét Sparsity1248 felsők
2496 TOP és Sparsity130 TOP125 TOPN/AN/AN/AN/A FP16 Compute2000 TFLOPs1600 TFLOPs312 TFLOP
624 TFLOP Sparity312 TFLOP-val
624 TFLOPs.0 TFLOPs.84 Sparsitys. AN/A FP32 Compute1000 TFLOPs800 TFLOPs156 TFLOPs
(19,5 TFLOPs standard)156 TFLOPs
(19,5 TFLOPs standard)16,4 TFLOPs15,7 TFLOPs TFLOPs10.6 TFLOP8 TFLOPs.
(9,7 TFLOP szabvány)19,5 TFLOP
(9,7 TFLOP szabvány)8,2 TFLOPs7,80 TFLOPs5,30 TFLOPs4,7 TFLOPs0,2 TFLOPs1,68 TFLOPs Memória interfész5120 bites HBM-bit HBM351Me-4B16bit HBM3514206 bit HBM24096 bites HBM24096 bites HBM24096 bites HBM2384 bites GDDR5384-bites GDDR5 memóriaméret Akár 80 GB HBM3 @ 3,0 Gbps Akár 80 GB HBM2e @ 2,0 Gbps Akár 40 GB HBM2 @ 1,6 TB/s
Akár 80 GB HBM2 @ 1,6 TB/sUp-2,0 TB/sUp 6/sUp
Akár 80 GB HBM2 @ 2,0 TB/s16 GB HBM2 @ 1134 GB/s16 GB HBM2 @ 900 GB/s16 GB HBM2 @ 732 GB/s16 GB HBM2 @ 732 GB/s
12 GB HBM2 @ 549 GB/S24 GB GDDR5 @ 288 GB/s12 GB GDDR5 @ 288 GB/s L2 gyorsítótár Size51200 KB51200 KB40960 KB40960 KB6144 KB6144 KB4096 KB4096 KB3072 KB1536 KB TDP700W350W400W250W250W300W300W250W250W235W