夏の間、Google は Tau T2A を Arm で実行する最初の Google Cloud Compute Engine VM として発表しました。 T2A シリーズは、Ampere Altra プロセッサを搭載しており、昨年発売された AMD EPYC 7003″Milan”プロセッサを搭載した Tau T2D シリーズを補完します。私は過去数週間、Tau T2A シリーズを試してきました。今日、Ampere Altra Arm VM が既存の T2D シリーズに対してどのように機能するかを示すための初期ベンチマークを共有します。
Ampere Altra現在、AMD EPYC Milan は Google の Tau VM を支えています。
Tau T2D シリーズは、Google と AMD のコラボレーションとして 2021 年後半に発売され、他のパブリック クラウド プロバイダーの代替品よりも高いパフォーマンスを提供します。 x86_64 ベースのインスタンス。それ以来、Google は Ampere Computing と協力して、Ampere Altra をパブリック クラウドに導入し、Tau ブランドに値する候補を考え出しています。
AMD EPYC を搭載した T2D シリーズと同様に、T2A も最適化されています。スケールアウト ワークロードの費用対効果の高いパフォーマンス。 T2A VM は、仮想マシンごとに最大 48 個の vCPU を備えており、各 vCPU は物理 CPU コアによって支えられています。また、vCPU ごとに 4 GB のメモリがあり、T2D VM と Amazon の M6g Graviton2 ベースのインスタンスに匹敵します。 Google は、T2D と同様に、T2A シリーズを Web サーバー、コンテナ化されたマイクロサービス、データ ログ処理、マルチメディアのエンコード/トランスコーディング、および Java ワークロードに最適であると説明しています。
Google は主要なすべてのUbuntu、RHEL、SUSE Linux Enterprise などの通常の競合製品から、Rocky Linux などの新しい参入者まで、T2A シリーズの AArch64 互換 Linux ディストリビューション。 T2A シリーズは、Google Kubernetes Engine、Dataflow、および x86_64 VM で長く利用できるその他のソフトウェアなど、他の Google Cloud サービスとも統合されています。
Google Tau T2A シリーズの背景情報については、 7 月の発表.
Google Tau T2A のラインナップが、既存の AMD EPYC を搭載した T2D シリーズとどのように比較されるのか知りたい方のために、Ubuntu 22.04 LTS を実行しながら、さまざまな Tau インスタンスで多数のベンチマークを実行しました。
Ubuntu 22.04 LTS インスタンスはデフォルトのままでしたが、x86_64 VM と AArch64 VM の両方の Jammy アーカイブにパッケージされている GCC 12 コンパイラにアップグレードして、AMD EPYC と Ampere の両方で最新のコンパイラを確保しました。 Altra プロセッサ。
Renaissance で実行されるような OpenJDK Java ワークロードの場合、Tau T2A シリーズは AMD と競合するパフォーマンスを発揮しました。 vCPU 数が少ない場合は T2A VM の方がわずかに優れたパフォーマンスを示し、vCPU が 48 の場合は引き分けでしたが、T2D AMD VM は vCPU を 60 個まで拡張できるという利点があります。
一方、要求の厳しい SPECjbb ベンチマークでは、推定パフォーマンスでは、AMD EPYC を搭載した T2D VM が T2A シリーズよりもはるかに優れたパフォーマンスを提供しました。 48 個の vCPU で、推定複合 max-jOPS は、T2A よりも EPYC T2D インスタンスの方が 64% 高速でした。
Apache Spark データ分析エンジンのパフォーマンスは、両方の Tau VM クラス間で競争力がありました。これは、Java/OpenJDK コミュニティが AArch64 で最適化されたサポートを絞り出し、そのソフトウェア エコシステムのサポートが良好な状態であることを確認するために多額の投資を行った結果です。
Apache Spark 内の SHA-512 操作の場合、Tau T2D インスタンス
OpenSSL 3.0 SHA256 のパフォーマンスは、テストした vCPU サイズ全体で T2A インスタンスと T2D インスタンスの間でほぼ一致しました。繰り返しになりますが、現在 48 個の vCPU でテーピングされている T2A シリーズよりも最大 60 個の vCPU を提供できるという AMD の利点があります。ただし、Google が Ampere Altra Max を搭載したインスタンスの提供を開始するなど、将来的に変更があるかどうかを確認します。.
Ubuntu 22.04 LTS で OpenSSL 3.0 の RSA4096 ベンチマークをすぐに使用できるため、SHA256 のパフォーマンスは T2A で良好な状態でしたが、Tau T2D シリーズは T2A VM よりもはるかに優れたスケーリングを示しました。.
48 vCPU サイズでは、T2D インスタンスは同じサイズの T2A インスタンスよりも 74% 高速でした。
PostgreSQL データベース サーバーのパフォーマンスについては、Tau T2D シリーズは一貫してT2A シリーズよりも優れたパフォーマンスを提供します。今後の PostgreSQL 15 で、新しい AArch64 の利点があるかどうかを確認しますが、現時点では、60 個の vCPU までスケールアップできることに加えて、Google の Tau T2D シリーズには大きな利点がありました。
Tau T2D シリーズは、Apache Cassandra データベースでも優れたパフォーマンスを発揮しました。
Calxeda サーバーをテストしていた時代にさかのぼって、Arm サーバーの CPU が年々競争力を高めてきたことは興味深いことです…差は確実に狭まりました。
ClickHouse データベース ソフトウェアでは、T2A インスタンスは 8 および 16 vCPU でより高速でしたが、より高い vCPU 数では潮目が変わりました。
Tau T2A VM は、自称「最新の Redis の代替品」である Dragonflydb の一部のテスト構成で競争力がありましたが、他のテスト構成では、AMD を搭載した T2D シリーズ
Redis 自体でf、AMD を搭載した T2D VM でより優れたパフォーマンスを提供し続けました。
CFD は Tau VM の主要な焦点の 1 つではありませんが、OpenFOAM を楽しむしかありませんでした..このオープンソースの計算流体力学パッケージでは、Tau VM 間で競争力のあるパフォーマンスがありました。 T2D シリーズの場合、利用可能な 60 個の vCPU インスタンス サイズによる優れたスケールアップ。
Tau T2D シリーズは、GROMACS および GPAW 科学計算パッケージに対しても一貫して優れたパフォーマンスを提供していましたが、やはりそうではありません。
ビルド ファーム用の Tau VM や、継続的インテグレーション (CI) セットアップなどの頻繁なコード コンパイル タスクを検討している場合、Tau T2D VM はビルド時間を短縮していました… のもちろん、各テストではそのシステムのネイティブ ISA に焦点を当てていましたが、つまり、CI パイプラインの直後であり、基盤となる CPU アーキテクチャをあまり気にしていない場合、T2D シリーズは最も速くビルドを好転させました。 AArch64 ベースの CI セットアップが必要な場合、Tau T2A は明らかに優れたオプションです。
AMD EPYC 7003″Milan”プロセッサを搭載した昨年の Google の Tau T2D シリーズの発売は大成功を収めました。 Armクラウドスペースへの最初の進出を準備しました。 T2A シリーズは、競争力のある価格設定と、AArch64 で十分にサポートされているスケールアウト ワークロードを備えた T2D シリーズを補完する優れた製品です。 T2D シリーズは全体的に、より成熟した x86_64 Linux ソフトウェア エコシステムにより、T2A シリーズをわずかに上回りました。 OpenJDK Java パフォーマンスのようなケースでは、SPECjbb 2015 のパフォーマンスは T2D インスタンスに劣っていましたが、T2A と T2D の間で競合するパフォーマンスがありました。多くのデータベース ワークロードでは、T2A と T2D の間で非常に健全な競争がありましたが、Redis、RocksDB、Cassandra、DragonFlyDB などのワークロードでは、間違いなく PostgreSQL が AMD EPYC を利用したインスタンスを支持して出てきました。 Tau VM の主要な焦点ではありませんが、T2D シリーズは、GROMACS、GPAW、OpenFOAM CFD などの HPC ワークロードでより強力になりました。 T2D シリーズは、ホストのネイティブ ISA を対象とするビルド時間も短縮されました。CI タイプのセットアップを探していて、上記のテストを実行するための基盤となるアーキテクチャをあまり気にしない場合です。
最後に両方の Google Tau VM クラスを評価して、特定のワークロードがどのように比較されるかを確認することは確かに有益です。 Tau T2A インスタンスは、Arm/AArch64 のパフォーマンスが確実に向上しており、さまざまなワークロードで最新の x86_64 と競合できる一方で、他の領域ではソフトウェア エコシステムに改善の余地があり、AArch64 向けにさらに調整を行う余地があることを示しています。少なくとも、Apple M1/M2 のような製品が手頃な価格の開発者ボックスとして Linux を実行し始めたことで、オープンソースの世界でさらなる進歩があり、オープンソースの AArch64 ソフトウェア サポートを強化し続けており、ギャップを埋めるのに役立つ可能性があります。一部の領域では、T2D で AMD EPYC を使用した x86_64 が大幅に優れたパフォーマンスを提供していました。
Ampere One と AMD EPYC Zen を考慮した次世代の Google Cloud インスタンスのパフォーマンスを確認することも非常に興味深いでしょう。また、数か月以内に 4 つのプロセッサがデビューする予定です。早期のベンチマークのために T2A インスタンスへの無料早期アクセスを提供してくれた Google に感謝します。