O Oak Ridge National Laboratory tem publicou a visão geral de seu sistema Crusher, que é alimentado por CPUs EPYC de 3ª geração otimizadas da AMD e GPUs Instinct MI250X.

Visão geral do sistema Crusher do ORNL publicado: apresenta CPUs EPYC de 3ª geração otimizadas e GPUs Instinct MI250X

O sistema Crusher é uma plataforma de teste para o próximo supercomputador Frontier do ORNL, que contará com o mais recente AMD EPYC’Trento’CPUs e GPUs Instinct MI250X’Aldebaran’. Como tal, ele tem um número menor de nós, mas, mesmo assim, tem muito impacto, dada a grande quantidade de núcleos de CPU/GPU que são apresentados nele.

ASUS lança AMD AGESA 1.2.0.6 BETA Firmware BIOS para suas placas-mãe ROG Crosshair VIII

O Crusher é um sistema de segurança moderada do Centro Nacional de Ciências Computacionais (NCCS) que contém hardware idêntico e software semelhante ao próximo sistema Frontier. Ele é usado como um teste de acesso antecipado para equipes do Center for Accelerated Application Readiness (CAAR) e Exascale Computing Project (ECP), bem como para a equipe do NCCS e nossos parceiros fornecedores.

via ORNL

A visão geral publicada pelo ORNL afirma que o sistema de teste Crushes consistirá em 2 gabinetes, um com 128 nós de computação e outro com 64 nós de computação, totalizando 192 nós de computação na configuração completa. Cada nó possui uma única CPU AMD EPYC 7A53 de 64 núcleos, baseada na arquitetura de CPU EPYC otimizada de 3ª geração. Sabemos que a Frontier será alimentada pelos CPUs Trento da AMD, que é uma versão otimizada do chip Milan. Possui os mesmos 64 núcleos e 128 threads, mas otimizações de clocks e eficiência de energia. Cada CPU terá acesso a 512 GB de memória DDR4.

Para o lado da GPU, cada nó contará com quatro GPUs AMD Instinct MI250X, empacotando 2 GCDs e cada nó trata o GCD como uma GPU separada para que o Crusher tenha acesso a 8 GPUs no total. Cada GPU MI250X oferece até 52 TFLOPs de potência de computação FP64 de pico, 220 unidades de computação (110 por GCD) e 128 GB de memória HBM2e (64 GB por GPU) para largura de banda de até 3,2 TB/s por acelerador MI250X. Cada GCD é conectado por meio de um link Infinity Fabric que oferece largura de banda bidirecional de 200 GB/s.

Falando sobre interconexões, as CPUs AMD EPYC são conectadas à GPU com Infinity Fabric com uma largura de banda máxima de 36 +36 GB/s. Os nós Crusher são conectados por meio de quatro NICs HPE Slingshot de 200 Gbit por segundo (25 GB/s), fornecendo uma largura de banda de injeção de nó de 800 Gbps (100 GB/s).

Há [4x] ] domínios NUMA por nó e [2x] regiões de cache L3 por NUMA para um total de [8x] regiões de cache L3. Cada uma das 8 GPUs está associada a uma das regiões L3 da seguinte forma:

NUMA 0:

threads de hardware 000-007, 064-071 | threads de hardware GPU 4 008-015, 072-079 | GPU 5

NUMA 1:

threads de hardware 016-023, 080-087 | Encadeamentos de hardware GPU 2 024-031, 088-095 | GPU 3

NUMA 2:

threads de hardware 032-039, 096-103 | Encadeamentos de hardware GPU 6 040-047, 104-111 | GPU 7

NUMA 3:

threads de hardware 048-055, 112-119 | threads de hardware GPU 0 056-063, 120-127 | GPU 1

O diagrama de blocos a seguir de um nó Crusher singular mostra as larguras de banda de interconexão entre as CPUs AMD EPYC e os aceleradores de GPU Instinct MI250X:

AMD RAMP é XMP para AMD Ryzen 7000 CPUs, acelera a memória DDR5 na plataforma AM5

Além disso, o sistema Crusher também aquece 250 PB de armazenamento com uma velocidade máxima de gravação de 2,5 TB/s, com acesso ao sistema central baseado em NFS sistema de arquivo. Espere ver mais das plataformas de CPU EPYC e GPU Instinct da AMD quando estiverem operacionais no supercomputador Frontier este ano.

Fonte de notícias: coelacanth-dream

Categories: IT Info