AMD Instinct MI300X, uma potência para grandes modelos de linguagem AI
A AMD divulga quanta energia o MI300X requer.
O design baseado em OAM (OCP Accelerator Module) do processador gráfico MI300X está listado com 750 W em slides AMD. Isso não foi mencionado pelos primeiros relatórios que cobrem o dia de introdução no início desta semana. Os requisitos de energia dessa placa foram identificados nas notas de rodapé após o evento.
A AMD desenvolveu uma versão especial de seu acelerador da série MI300 exclusivamente com blocos CDNA3. Este acelerador será oferecido junto com o MI300A, o chamado APU de data center exascale, que possui 24 núcleos Zen4 combinados com blocos de GPU.
O MI300X aumentou os blocos de núcleo de GPU e tem mais memória (192 GB) graças ao as pilhas HBM3 de 24 GB recentemente introduzidas. A potência bruta da GPU combinada com muita memória contribuiu para uma maior potência, atingindo agora 750 W para um dos módulos OAM. Isso é mais do que o MI250X de última geração (CDNA2), que subiu apenas para 560 W.
Instinct MI300WX TBP, Fonte: AMD
No passado Nos últimos anos, os requisitos de energia para produtos de centro de dados de GPU aumentaram. O TDP da GPU NVIDIA H100 SXM sobe para 700 W e 350 W para a versão PCIe refrigerada a ar. A versão PCIe da GPU Intel Max 1550 Data Center baseada em silício Ponte Vecchio também requer pelo menos 600 W de energia.
A nomeação dos requisitos de energia e projetos varia de acordo com o fabricante. Características de energia como TDP, TBP ou Power Envelope podem nem sempre significar a mesma coisa. Mas o importante é que a rivalidade da GPU no espaço do data center está apenas começando, então quem sabe se veremos especificações de energia ainda mais altas listadas em slides oficiais em breve.
Fonte: AMD via Hoang Anh Phu