Ampere Computing は今朝、AmpereOne プロセッサ ファミリが生産に入ったことを発表し、社内設計の Arm サーバー プロセッサに関する追加の詳細を提供しました。
新しい AmpereOne コアは次のとおりです。同社が以前に開示したように、社内のカスタムコア設計です。 AmpereOne はクラウド サービス プロバイダー向けに設計されており、ソケットあたり最大 192 個の物理コアを提供します。これは、現在 Ampere Altra Max で提供されているすでに驚異的な 128 コアをはるかに上回っています。
私は、Ampere Computing の更新されたロードマップについて事前に説明を受けましたが、AmpereOne が製品化され、顧客とサンプルを提供している間に、私は、AmpereOne プラットフォームを直接テストして、そのパフォーマンスと電力効率を個別に確認する機会がまだありません。それがすぐに実現することを願っています。 AmpereOne に関する一部の詳細は、事前説明会ではクロック速度、価格情報、パブリック クラウド サービス プロバイダーによる可用性を含む SKU テーブルが開示されていないなど、まだ限定されています。予想通り、AmpereOne は DDR5 および PCIe Gen 5.0 に移行し、最新の AMD EPYC”Genoa”および Intel Xeon スケーラブル”Sapphire Rapids”プロセッサの機能と一致します。
新機能AmpereOne カスタム コアは、Bfloat16、メモリ タグ付け、単一キー メモリ暗号化、安全な仮想化、強化された電源管理、および以前の Ampere Altra および Ampere Altra Max プロセッサに対するその他のさまざまな改善点です。
側面の 1 つAmpereOne で最も驚いたのは、少なくとも現時点では、Ampere Altra/Altra Max でカバーされていないより高いコア数に制限していることです。言い換えれば、AmpereOne は 136/144/160/176/192 コア数に対応しています… 現在、Ampere Altra ファミリでカバーされている 128 コア以下の AmpereOne プロセッサは計画されていません。おそらくこれは、VM 密度の最大化に関心のあるクラウド サービス プロバイダーを真正面から新しいプロセッサにターゲットにしているという大きな賭けによるものと思われます。私は、よりコア数の少ない AmpereOne 開発者向けプロセッサの可能性について、またはコア数は少なくしたいが BFloat16 用の AmpereOne やこれらの新しいプロセッサに搭載されているその他の新機能に興味がある人向けに問い合わせましたが、現在、このセグメントで計画されている製品はありません。言い換えれば、大きくするか、家に帰るかです。
192 コア数の AmpereOne のトップエンドでは、使用電力レポートは約 350 ワットです。 AmpereOne は、Intel Sapphire Rapids と同様に 8 チャネルの DDR5 メモリを利用しますが、AMD Genoa が利用する 12 チャネルの DDR5 よりも下回ります。
Ampere のカスタム コアは、1 あたり 64KB の 4 ウェイ L1 データ キャッシュを備えています。コア、コアあたり 16KB の L1 命令キャッシュ、およびコアあたり 2MB の L2 キャッシュ。おそらく TSMC の製造プロセスのアップグレードにより電力効率が向上していると言われていますが、正確な詳細は明らかにされていません。
Ampere Computing ははるかに多くの VM を報告しています。 AmpereOne では、可能な物理 CPU コアの数と物理コアあたり 1 つの VM のみに基づいて評価を行っています。したがって、この主張は実際にはかなり疑わしいものであり、前述の VM の潜在的な電力/パフォーマンスを考慮せずに、ラックあたりの可能な最大コア数を報告しているだけです。
Ampere が提供する初期ベンチマークは、 AmpereOne はかなり限定的です。生成 AI の安定拡散のベンチマークと、AI の推奨に DLRM を使用します。 AmpereOne は、AMD EPYC 9654″Genoa”よりも 2.3 倍の 1 秒あたりのフレーム数を実現し、DLRM では EPYC 9654 の 2 倍以上の 1 秒あたりのクエリ数を提供すると報告されています。残念ながら、今日の発表で示されているのは、これら 2 つの AI パフォーマンス ベンチマークだけです。
プレゼンテーションの最後のノートを確認する際に指摘すべき重要な項目の 1 つは、DLRM ベンチマークでは FP16 を使用して AmpereOne をテストしているのに対し、AMD では EPYC 9654 は FP16 を使用してテストされているということでした。 FP32。 AmpereOne では、DLRM 時のシステム平均電力が 534 ワットであるのに対し、AMD EPYC Genoa 9654 では 512 ワットでした。
Ampere Computing は、次のようなハードウェア ベンダーからの幅広いパートナーの配置を示して説明会を終了しました。 Giga Computing、Foxconn、HPE、Supermicro から Microsoft Azure、Tencent Cloud、Google Cloud などのパブリック クラウドまで。これは現在のパートナーを示すものであり、AmpereOne ハードウェアがいつ登場するのか、またはパブリック クラウドでこれら 192 個のコア サーバー プロセッサが登場し始めるのかはまだわかりません。
私はこのときに言われました。私の説明によると、初期のカーネル アップストリームと、GCC および LLVM Clang のコンパイラ サポートがすでに導入されているおかげで、主要な AArch64 Linux ディストリビューションは AmpereOne 上で実行できるようになるはずです。これらの以前のコンパイラ パッチにより、AmpereOne が ARMv8.6 ISA に基づいていることが確認されました。
今日の Ampere Computing ロードマップ開示の情報はここまでです。願わくば、近いうちに、AmpereOne ハードウェアをテスト用に入手して、さまざまなベンチマークにわたってそのパフォーマンスと電力効率を独立して確認できるようになることを願っています。