GPUs AMD Instinct MI300 que serão alimentadas pela próxima geração de CDNA 3 foram detalhadas por Moore’s Law is Dead. As novas GPUs alimentarão os próximos data centers e há rumores de que serão as primeiras a incorporar um design de empilhamento 3D.

GPUs AMD Instinct MI300 Rumores para ir all-onboard com design de empilhamento 3D: até Quatro Chiplets de GPU com 8 Compute Dies, HBM3 e PCIe Gen 5.0 a 600W

No ano passado, @Kepler_L2 revelou que o AMD Instinct MI300 apresentaria quatro Graphics Compute Dies. Mais tarde, isso foi confirmado em um patch onde o chip apareceu como a parte’GFX940′. Isso basicamente duplicaria o MI250X, que possui dois GCDs, mas a diferença é que cada GCD apresentará duas matrizes de computação. Portanto, para o Instinct MI300, teremos até 8 GCDs na variante superior. Na verdade, a família Instinct MI300 não será uma GPU única, mas incluirá várias configurações diferentes.

GPU principal AMD RDNA3 Navi 31 de última geração’Radeon RX 7900’no cronograma

Os detalhes da GPU AMD Instinct MI300’CDNA 3’foram revelados pela Lei de Moore está morta.

A GPU AMD Instinct MI300 terá um interposer maciço que mede cerca de ~2750 mm2. O interposer tem uma configuração muito interessante que embala quatro tiles de 6nm que contêm os controladores de I/O, IP Blocks e medem em torno de ~320-360mm2. Esses blocos são baseados em um nó de 6 nm e também podem incluir alguma forma de cache, embora isso ainda não esteja confirmado. Agora, além dessas pilhas de E/S, a AMD usará a nova tecnologia de empilhamento 3D para incorporar dois Compute Dies.

Esses novos Compute Dies baseados na arquitetura AMD CDNA 3 serão fabricados em um nó de 5 nm e apresentam um tamanho de matriz de cerca de 110 mm2 por ladrilho. Atualmente, não há nenhuma palavra sobre quantos blocos de núcleo ou acelerador cada dado de computação suportará, mas se mantivermos a mesma contagem de SP/core do MI250X, chegaremos a 28.160 núcleos, mas mais uma vez, isso é apenas mera especulação, pois muito pode mudar dentro do CDNA 3. Como os controladores de memória estão integrados na matriz de E/S inferior, eles são conectados a duas pilhas de HBM3 usando mais de 12 camadas de metal. Cada matriz é interconectada usando um total de 20.000 conexões, o dobro do que a Apple está usando no M1 Ultra como parte do design do chip UltraFusion.

Comparação de especificações de memória HBM

DRAMHBM1HBM2HBM2eHBM3 I/O (interface de barramento)1024102410241024 Pré-busca (E/S)2222 Largura de banda máxima128 GB/s256 GB/s460,8 GB/s819,2 GB/s CIs DRAM por pilha48812 Capacidade máxima4 GB8 GB16 GB24 GB tRC48ns45ns45nsTBA tCCD2ns (=1tCK)2ns (=1tCK)2ns (=1tCK)TBA VPPEVPPE externoVPPE externoVPP externo
VPP externo
VDD1.2V1.2V1.2VTBA Comando InputDual CommandDual CommandDual CommandDual Command

Agora, enquanto a AMD ainda depende do 8-pilhas, eles são o padrão HBM3 mais recente, que é o mesmo que a NVIDIA está usando para suas GPUs Hopper. Atualmente, o MI250X usa 8 pilhas HBM2e que são 8-hi e apresentam 16 GB de memória por pilha (128 GB por módulo). Pode ser provável que a AMD aumente as pilhas para 12-Hi, algo que a SK Hynix já provocou há algum tempo. Isso permitiria até 192 GB de capacidade de memória na configuração superior da GPU Instinct MI300, marcando um aumento de 50%. Quanto ao TDP, cada bloco CDNA 3 (1x 6nm + 2x 5nm dies) terá um TDP de cerca de 150W. Quanto às configurações, elas são as seguintes:

Configuração superior: 4x IO Die (6nm) + 4x GCDs (5nm) + 8x Compute Dies (5nm) Mid Config: 2x IO Die (6nm) + 2x GCDs (5nm) + 4x Compute Dies (5nm) Configuração Baixa: 1x IO Die (6nm) + 1x GCDs (5nm) + 2x Compute Dies (5nm) )

Configurações da GPU AMD Instinct MI300 (Créditos da imagem: A lei de Moore está morta):

AMD Ryzen 7000’Raphael’Desktop & EPYC 7004 CPUs de servidor’Genoa’confirmadas para suportar velocidades de memória nativa DDR5-5200

Com base nisso, a configuração superior consumirá cerca de 600W de energia, a configuração intermediária consumirá cerca de 300W de energia enquanto a configuração de entrada-configuração de nível consumirá cerca de 150W de energia. Atualmente, a configuração superior do Instinct MI250X consome 560 W de energia e vem no formato OAM.

Aceleradores AMD Radeon Instinct 2020

Nome do aceleradorAMD Instinct MI300AMD Instinct MI250XAMD Instinct MI250AMD Instinct MI210AMD Instinct MI100AMD Radeon Instinct MI60AMD Radeon Instinct MI50AMD Radeon Instinct MI25AMD Radeon Instinct MI8AMD Radeon Instinct MI6 GPU ArchitectureTBA (CDNA 3)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Aldebaran (CDNA 2)Arcturus (CDNA 1)Vega 20Vega 20Vega 10Fiji XTPolaris 10 GPU Process Node5nega 10Fiji XTPolaris +6nm6nm6nm6nm7nm FinFET7nm FinFET7nm FinFET14nm FinFET28nm14nm FinFET GPU Dies4 (MCM/3D Stacked)2 (MCM)2 (MCM)1 (MCM)1 (Monolítico)1 (Monolítico)1 (Monolítico)1 (Monolítico)1 (Monolítico)1 (Monolítico) ) GPU Cores28,160? 14,08013,3126656768040963840409640962304 GPU relógio SpeedTBA1700 MHz1700 MHz1700 MHz1500 MHz1800 MHz1725 MHz1500 MHz1000 MHz1237 MHz FP16 ComputeTBA383 TOPs362 TOPs181 TOPs185 TFLOPs29.5 TFLOPs26.5 TFLOPs24.6 TFLOPs8.2 TFLOPs5.7 TF LOPs FP32 ComputeTBA95.7 TFLOPs90.5 TFLOPs45.3 TFLOPs23.1 TFLOPs14.7 TFLOPs13.3 TFLOPs12.3 TFLOPs8.2 TFLOPs5.7 TFLOPs FP64 ComputeTBA47.9 TFLOPs45.3 TFLOPs22.6 TFLOPs11.5 TFLOPs7.4 TFLOPs76 TFLOPs7.4 TFLOPs76 TFLOPs7.4 TFLOPs76 TFLOPs7.4 TFLOPs76 TFLOPs7.4 GFLOPs512 GFLOPs384 GFLOPS VRAM192 GB HBM3? 128 GB HBM2e128 GB HBM2e64 GB HBM2e32 GB HBM232 GB HBM216 GB HBM216 GB HBM24 GB HBM116 GB GDDR5 memória ClockTBA3.2 Gbps3.2 Gbps3.2 Gbps1200 MHz1000 MHz1000 MHz945 MHz500 MHz1750 MHz Memória Bus8192-bit8192-bit8192-bit4096-bit4096-bit bus4096-bit bus4096-bit bus2048-bit bus4096-bit bus256-bit Memória BandwidthTBA3,2 TB/s3,2 TB/s1,6 TB/s1,23 TB/s1 TB/s1 TB/s484 GB/S512 GB/S2224 GB/S FORMUTOMOAMOAMOAMOAMDUAL CARTUAL DO CARTUAL DO LIMPO DO LIMPO, LIMPO DE LIMPO DE LIMPO DE LIMPTERAÇÃO FUNDO, SLOTO COMPLETO DE CONFRIMATHOTHOTHOTHO10O SLOTO COFRIVO10O10O SLOTO COFFRIFRIVETO1O SLOTO COFFRIFRIVENTIVO SLOFTIVO SLUCO SLOFRO FRIFRIFORTIVO SLUFPPRESSPASSPPASSTIVASSPURPASTIVAS COFRIVIVIVIVIVIVIVIVIVIVIVIVIVIagem de resfrição de resfrição de resfrição

Categories: IT Info