新しい技術ブログ、NVIDIAはついに既存のAmpereA100アクセラレータをAMDInstinctMI250GPUと比較するいくつかの数値を共有しました。

NVIDIA AmpereA100GPUとAMDのInstinctMI250の2倍のパフォーマンスとほぼ3倍の効率を主張

NVIDIAは、ホッパーグラフィックス(GPU)アーキテクチャに基づく次世代H100 GPUをすでに発表しており、この後、お客様に出荷されます。年。ホッパーGPUは、6年前にリリースされたPascal P100の推定26倍のパフォーマンス向上を実現します。これは、ムーアの法則が提供する軌道の3倍の速さです。

NVIDIAはISC2022でConnectX-7を披露します:80億トランジスタを搭載した次世代スイッチ

パフォーマンステストでは、NVIDIAはシングルGPU構成とマルチGPU構成の両方でAmpereA100GPUをテストしました。同じ構成がAMDのInstinctMI250に使用されました。 LAMMPS、NAMD、openMM、GROMACS、AMBERなどの最も人気のあるデータセンターワークロードのいくつかがパフォーマンステストに使用されました。

NVIDIAの単一のAmpereA100GPUは、AMDよりも最大1.9倍高速であることが判明しました。クアッドGPUソリューションがAmpereシステムで最大2.1倍のゲインを示している間、本能的なMI250GPUアクセラレーター。エネルギー効率において、クアッドGPUソリューションは2.8倍高いパフォーマンス/ワットを提供しました。

NVIDIA A100 GPUの優れたパフォーマンスと電力効率は、長年の執拗なソフトウェアとハ​​ードウェアの共同の結果です。-アプリケーションのパフォーマンスと効率を最大化するための最適化。 NVIDIA Ampereアーキテクチャの詳細については、 NVIDIA A100 Tensor CoreGPUホワイトペーパー。

A100は、オペレーティングシステムに対して単一のプロセッサとしても提供され、そのMPIランクを最大限に活用するには1つのMPIランクのみを起動する必要があります。パフォーマンス。また、A100は、 600 GB/s NVLink接続のおかげで、大規模で優れたパフォーマンスを提供します。 ノード内のすべてのGPU間。

テストの注意事項は次のとおりです。

の効率比示されているA100からMI250–NVIDIAには高いほど良い。アプリケーションごとの複数のデータセット(さまざま)の幾何平均。効率は、NVIDIA SMIとROCmの同等の機能を使用して測定されたGPUで測定されたパフォーマンス/消費電力(ワット)です|

(2)AMDEPYC7763を搭載したGIGABYTEM262-HD5-00で測定されたAMDMI250 4xAMDInstinct™MI250OAM(128 GB HBM2e)500WGPUとAMDInfinityFabric™テクノロジーを搭載。 NVIDIAは、デュアルEPYC 7713CPUと4xA100(80 GB)SXM4

LAMMPS development_db00b49(AMD)develop_2a35ec2(NVIDIA)データセットReaxFF/c、Tersoff、Leonard-Jones、SNAPを使用してProLiant XL645dGen10Plusで実行されます。 NAMD3.0alpha9データセットSTMV_NVE| OpenMM 7.7.0 Ensembleは、データセットに対して実行されます:amber20-stmv、amber20-セルロース、apoa1pme、pme |

GROMACS 2021.1(AMD)2022(NVIDIA)データセットADH-Dodec(h-bond)、STMV(h-ボンド)| AMBER 20.xx_rocm_mr_202108(AMD)および20.12-AT_21.12(NVIDIA)データセットCellulose_NVE、STMV_NVE | 1xMI250には2xGCDがあります

NVIDIA経由

ここで使用されているAMDInstinctMI250は、MI250X上にあるため、完全な構成ではないことに注意してください。これらの結果に基づくと、A100はAMDCDNA2製品に対して依然として非常に競争力があるはずです。ホッパーが間もなく登場することで、NVIDIAはこれらの数値をさらに推し進め、AMDのInstinctMI300がその真新しいAPUのようなデザインで登場します。

Categories: IT Info