Intelは本日、International Supercomputing(ISC)2021会議で多数の発表を行い、スーパーコンピューティングおよびHPCアプリケーション向けの幅広いソリューションについて話しました。ハードウェアの面での大きなニュースは、IntelのSapphire RapidsデータセンターチップにHBMメモリ、DDR5、PCIe 5.0、およびCXL1.1のサポートが付属することです。さらに、Intelは Ponte Vecchio GPU は、パッケージあたり最大600Wを消費するとされるOAMフォームファクタで提供されます。 Ponte Vecchio GPUは、4つまたは8つのGPUのクラスターで提供されます。

Intel Xeon Sapphire Rapids Coming with HBM(High Bandwidth Memory)

Sapphire Rapi ds

(画像クレジット:Intel)

Intelはたくさんの情報をだましましたSapphire Rapids Xeonサーバーチップに関する情報、一部は意図的に、思わず私。チップには、ゴールデンコーブアーキテクチャがエッチングされた状態で付属することはすでにわかっています。 10nm Enhanced SuperFin プロセスに進みます。 Intel 2020年6月に最初にチップの電源を入れました、また、DDR5、PCIe 5、およびCXL 1.1をサポートしており、EagleStreamプラットフォームに組み込まれます。チップは、トレーニングおよび推論ワークロードのパフォーマンスを向上させることを目的としたIntel Advanced Matrix eXtensions(AMX)もサポートします。

Intelが公開しましたチップにはHBMメモリが付属しますが、チップがサポートする容量や使用するメモリの種類は指定されていません。この追加メモリは、Sapphire Rapids CPUコアと同じパッケージに搭載されますが、HBMがヒートスプレッダの下にあるのか、より大きなパッケージの一部として接続されるのかはまだ明確ではありません。

Intelは確認済みですチップは、標準のSapphire Rapids製品スタックの一部としてすべての顧客が利用できるようになりますが、同じ大まかな時間枠ではありますが、HBMのないバリアントよりも少し遅れて市場に出る予定です。

Intelは、HBMをオペレーティングシステムに公開する方法についてまだその帽子をかぶっていません。これは、L4キャッシュ、L3キャッシュの拡張、または標準のメインメモリの補助として考えられます。 。ただし、Intelは、チップがメインメモリ(DDR5)の有無にかかわらず使用できることを明らかにしました。つまり、さまざまなメモリ構成にはいくつかのオプションがある可能性があります。

Intelによると、HBMメモリは、コア数にそれほど敏感ではないメモリバウンドワークロードに役立つとのことです。おそらく、これらのチップに標準モデルよりも少ないコアが搭載されることを示しています。同じヒートスプレッダーの下でHBMに対応する必要があることを考えると、これは理にかなっています。対象となるワークロードには、数値流体力学、気候と天気予報、AIトレーニングと推論、ビッグデータ分析、インメモリデータベース、ストレージアプリケーションが含まれます。

Intelは詳細を明らかにしていませんが、最近のリークは、最大 56コアと64GBのHBM2Eメモリがマルチ-ダイ間にEMIB相互接続を備えたチップパッケージ。

Intel Ponte VecchioOAMフォームファクター

Ponte Vecchio

(画像クレジット:Intel)

Intelは、XeHPCシリコンを発表しました。これを使用して、 1,000億個のトランジスタを備えた47タイルのPonteVecchioチップを作成します。 、現在、neのシステムで検証されていますwマルチGPUの実装。さらに、同社は、チップがOAM(Open Accelerator Module)フォームファクターで提供されることを共有しました。以前のレポートの確認。

ポンテヴェッキオ

(画像クレジット:Intel)

OAMフォームファクターは、OCP(Open Compute Platform)エコシステムで使用するように設計されており、キャリアにマウントされたGPUダイで構成され、その後、マザーボードに接続されます。メザニンコネクタを介して。このタイプの配置は、 NvidiaのSXMフォームファクターに似ています。

これらのタイプのチップパッケージは、追加するよりもサーバーではるかに一般的です。-カードフォームファクターでは、従来のカードフォームファクターよりも強力な冷却システムが可能になると同時に、PCBを介してOAMパッケージに電力をルーティングする最適化された方法を提供します(PCIeケーブルではありません)。

リークされたIntelドキュメントには、ピーク時600WのPonte VecchioOAMパッケージが記載されていますであり、すべての兆候は、液体冷却を使用するGPUモデルの少なくとも一部を示しています。ただし、それほど強力ではないバリアントには空冷オプションがある可能性があります。

Ponte Vecchio

(画像クレジット:Intel)

Intelは、4つまたは8つのノードを提供しますインストールされているOAMパッケージ。x4またはx8サブシステムと呼ばれます。これらのノードは、顧客のサーバーに統合されます。 Intelは現在これらのマルチGPU設計を検証しています。

最初のPonteVecchio GPUは、エネルギー省の Auroraスーパーコンピューターですが、そのエクサスケールシステムは数回(6年以上)遅延しており、最新のものはIntelの7nm遅延の手に渡り、最終的にはTSMCによって製造されている16のPonteVecchioコンピューティングタイルで。デザインの詳細については、こちらをご覧ください。

Intelは、Auroraが上記のx4またはx8フォームファクターを使用しないことを確認しました。各Auroraブレードは、2つのSapphire Rapids CPU(6:1の比率)とペアになった6つのPonte VecchioGPUで構成されます。 Intelはまた、ドイツ、ムンチェンのSuperMUC-NGスーパーコンピューター。このシステムには、PonteVecchioとSapphireRapidsがペアになった240の新しいノードがありますが、それらがx4またはx8スレッドを使用しているかどうかは不明です。

Categories: IT Info