AI 大規模言語モデルの強力な AMD Instinct MI300X

AMD は、MI300X が必要とする電力量を明らかにしています。

MI300X グラフィックス プロセッサの OAM ベース (OCP アクセラレータ モジュール) 設計は、AMD スライドに 750W と記載されています。このことについては、今週初めの導入日を報じた初期の報道では言及されていなかった。このボードの電力要件は、イベント後の脚注で発見されました。

AMD は、CDNA3 タイルのみを使用した MI300 シリーズ アクセラレータの特別バージョンを開発しました。このアクセラレータは、GPU タイルと組み合わせた 24 個の Zen4 コアを備えた、いわゆるデータセンター エクサスケール APU である MI300A と一緒に提供されます。

MI300X は、GPU コア タイルが増加し、メモリ (192GB) のおかげでより多くのメモリを搭載しています。最近導入された 24GB HBM3 スタック。生の GPU パワーと大量のメモリの組み合わせにより、現在 1 つの OAM モジュールで 750 W に達する高パワーが実現されています。これは、最大 560 W までだった前世代 (CDNA2) MI250X よりも優れています。

Instinct MI300WX TBP、出典: AMD

これまでここ数年、GPU データセンター製品の電力要件が増加しています。 NVIDIA H100 SXM GPU TDP は最大 700 W、PCIe 空冷バージョンでは 350 W になります。 Ponte Vecchio シリコンをベースとした Intel Max 1550 Data Center GPU の PCIe バージョンも、少なくとも 600 W の電力を必要とします。

電力要件と設計の名称はメーカーによって異なります。 TDP、TBP、パワーエンベロープなどの電力特性は、必ずしも同じことを意味するとは限りません。しかし重要なことは、データセンター分野における GPU の競争は始まったばかりであるため、公式スライドにさらに高い電力の仕様がすぐに記載されるかどうかは誰にも分からないということです。

出典: AMD ホアン・アイン・フー

経由

Categories: IT Info