AMD Instinct MI300X, ein Kraftpaket für KI-Modelle mit großen Sprachen

AMD gibt bekannt, wie viel Leistung der MI300X benötigt.

Das OAM-basierte (OCP Accelerator Module) Design des MI300X-Grafikprozessors wird auf AMD-Folien mit 750 W aufgeführt. Dies wurde in ersten Berichten über den Einführungstag Anfang dieser Woche nicht erwähnt. Dieser Leistungsbedarf der Platine wurde in den Fußnoten nach der Veranstaltung entdeckt.

AMD entwickelte eine spezielle Version seines Beschleunigers der MI300-Serie ausschließlich mit CDNA3-Kacheln. Dieser Beschleuniger wird zusammen mit MI300A angeboten, der sogenannten Exascale-APU für Rechenzentren, die über 24 Zen4-Kerne in Kombination mit GPU-Kacheln verfügt.

Der MI300X verfügt über mehr GPU-Kernkacheln und verfügt über mehr Speicher (192 GB). die kürzlich eingeführten 24-GB-HBM3-Stacks. Die reine GPU-Leistung in Kombination mit viel Speicher hat zu einer höheren Leistung beigetragen, die nun 750 W für ein OAM-Modul erreicht. Das ist mehr als beim MI250X der letzten Generation (CDNA2), der nur auf 560 W anstieg.

Instinct MI300WX TBP, Quelle: AMD

In der Vergangenheit In den letzten Jahren ist der Strombedarf für GPU-Rechenzentrumsprodukte gestiegen. Die TDP der NVIDIA H100 SXM GPU steigt auf 700 W und 350 W für die luftgekühlte PCIe-Version. Die PCIe-Version der Intel Max 1550 Data Center GPU auf Basis von Ponte-Vecchio-Silizium benötigt ebenfalls mindestens 600 W Leistung.

Die Benennung von Leistungsanforderungen und Designs variiert je nach Hersteller. Leistungsmerkmale wie TDP, TBP oder Power Envelope bedeuten möglicherweise nicht immer dasselbe. Aber das Wichtigste ist, dass die GPU-Rivalität im Rechenzentrumsbereich gerade erst begonnen hat, also wer weiß, ob wir bald noch höhere Leistungsspezifikationen auf offiziellen Folien sehen werden.

Quelle: AMD über Hoang Anh Phu

Categories: IT Info