GPUs AMD Instinct MI300 que serão alimentadas pela próxima geração de CDNA 3 foram detalhadas por Moore’s Law is Dead. As novas GPUs alimentarão os próximos data centers e há rumores de que serão as primeiras a incorporar um design de empilhamento 3D.
GPUs AMD Instinct MI300 Rumores para ir all-onboard com design de empilhamento 3D: até Quatro Chiplets de GPU com 8 Compute Dies, HBM3 e PCIe Gen 5.0 a 600W
No ano passado, @Kepler_L2 revelou que o AMD Instinct MI300 apresentaria quatro Graphics Compute Dies. Mais tarde, isso foi confirmado em um patch onde o chip apareceu como a parte’GFX940′. Isso basicamente duplicaria o MI250X, que possui dois GCDs, mas a diferença é que cada GCD apresentará duas matrizes de computação. Portanto, para o Instinct MI300, teremos até 8 GCDs na variante superior. Na verdade, a família Instinct MI300 não será uma GPU única, mas incluirá várias configurações diferentes.
GPU principal AMD RDNA3 Navi 31 de última geração’Radeon RX 7900’no cronograma
Os detalhes da GPU AMD Instinct MI300’CDNA 3’foram revelados pela Lei de Moore está morta.
A GPU AMD Instinct MI300 terá um interposer maciço que mede cerca de ~2750 mm2. O interposer tem uma configuração muito interessante que embala quatro tiles de 6nm que contêm os controladores de I/O, IP Blocks e medem em torno de ~320-360mm2. Esses blocos são baseados em um nó de 6 nm e também podem incluir alguma forma de cache, embora isso ainda não esteja confirmado. Agora, além dessas pilhas de E/S, a AMD usará a nova tecnologia de empilhamento 3D para incorporar dois Compute Dies.
Esses novos Compute Dies baseados na arquitetura AMD CDNA 3 serão fabricados em um nó de 5 nm e apresentam um tamanho de matriz de cerca de 110 mm2 por ladrilho. Atualmente, não há nenhuma palavra sobre quantos blocos de núcleo ou acelerador cada dado de computação suportará, mas se mantivermos a mesma contagem de SP/core do MI250X, chegaremos a 28.160 núcleos, mas mais uma vez, isso é apenas mera especulação, pois muito pode mudar dentro do CDNA 3. Como os controladores de memória estão integrados na matriz de E/S inferior, eles são conectados a duas pilhas de HBM3 usando mais de 12 camadas de metal. Cada matriz é interconectada usando um total de 20.000 conexões, o dobro do que a Apple está usando no M1 Ultra como parte do design do chip UltraFusion.
Comparação de especificações de memória HBM
Agora, enquanto a AMD ainda depende do 8-pilhas, eles são o padrão HBM3 mais recente, que é o mesmo que a NVIDIA está usando para suas GPUs Hopper. Atualmente, o MI250X usa 8 pilhas HBM2e que são 8-hi e apresentam 16 GB de memória por pilha (128 GB por módulo). Pode ser provável que a AMD aumente as pilhas para 12-Hi, algo que a SK Hynix já provocou há algum tempo. Isso permitiria até 192 GB de capacidade de memória na configuração superior da GPU Instinct MI300, marcando um aumento de 50%. Quanto ao TDP, cada bloco CDNA 3 (1x 6nm + 2x 5nm dies) terá um TDP de cerca de 150W. Quanto às configurações, elas são as seguintes:
Configuração superior: 4x IO Die (6nm) + 4x GCDs (5nm) + 8x Compute Dies (5nm) Mid Config: 2x IO Die (6nm) + 2x GCDs (5nm) + 4x Compute Dies (5nm) Configuração Baixa: 1x IO Die (6nm) + 1x GCDs (5nm) + 2x Compute Dies (5nm) )
Configurações da GPU AMD Instinct MI300 (Créditos da imagem: A lei de Moore está morta):
AMD Ryzen 7000’Raphael’Desktop & EPYC 7004 CPUs de servidor’Genoa’confirmadas para suportar velocidades de memória nativa DDR5-5200
Com base nisso, a configuração superior consumirá cerca de 600W de energia, a configuração intermediária consumirá cerca de 300W de energia enquanto a configuração de entrada-configuração de nível consumirá cerca de 150W de energia. Atualmente, a configuração superior do Instinct MI250X consome 560 W de energia e vem no formato OAM.