A Intel fez uma série de anúncios na conferência International Supercomputing (ISC) 2021 hoje, apresentando sua ampla gama de soluções para aplicativos de supercomputação e HPC. A grande notícia no front do hardware é que os chips Sapphire Rapids do data center da Intel viriam com memória HBM, DDR5, PCIe 5.0 e suporte para CXL 1.1. Além disso, a Intel confirmou que seu As GPUs Ponte Vecchio virão em um formato OAM que supostamente consome até 600W por pacote. As GPUs da Ponte Vecchio virão em clusters de quatro ou oito GPUs.
Intel Xeon Sapphire Rapids Coming with HBM (High Bandwidth Memory)
A Intel já coletou muitos informações sobre seus chips de servidor Sapphire Rapids Xeon, alguns intencionalmente, então mim sem querer. Já sabemos que os chips virão com a arquitetura Golden Cove gravada no processo 10nm Enhanced SuperFin . A Intel ligou os chips pela primeira vez em junho de 2020 , e eles vêm com suporte DDR5, PCIe 5 e CXL 1.1 e irão cair nas plataformas Eagle Stream. Os chips também suportam Intel Advanced Matrix eXtensions (AMX) voltados para melhorar o desempenho em cargas de trabalho de treinamento e inferência.
Agora a Intel divulgou que os chips virão com memória HBM, embora a empresa não tenha especificado quanta capacidade os chips suportarão ou que tipo de memória eles usarão. Esta memória adicional vai rodar no mesmo pacote que os núcleos de CPU Sapphire Rapids, embora ainda não esteja claro se o HBM estará sob o dissipador de calor ou conectado como parte de um pacote maior. A Intel confirmou que os chips estarão disponíveis para todos os seus clientes como parte da pilha de produtos Sapphire Rapids padrão, embora cheguem ao mercado um pouco mais tarde do que as variantes sem HBM, embora no mesmo período de tempo aproximado. A Intel ainda não descobriu como exporá o HBM ao sistema operacional: pode ser concebivelmente como um cache L4, uma extensão do cache L3 ou como um adjunto à memória principal padrão. No entanto, a Intel divulgou que os chips podem ser usados com ou sem memória principal (DDR5), o que significa que provavelmente existem várias opções para várias configurações de memória. A Intel diz que a memória HBM ajudará com cargas de trabalho ligadas à memória que não são tão sensíveis à contagem de núcleos, talvez sinalizando que esses chips virão com menos núcleos do que os modelos padrão. Isso faz sentido dada a necessidade de possivelmente acomodar o HBM sob o mesmo dissipador de calor. As cargas de trabalho alvo incluem dinâmica de fluidos computacional, previsão de clima e tempo, treinamento e inferência de IA, análise de big data, bancos de dados em memória e aplicativos de armazenamento. A Intel não divulgou mais detalhes, mas vazamentos recentes apontam para os chips chegando com até 56 núcleos e 64 GB de memória HBM2E em um multi pacote de chips com interconexões EMIB entre a matriz. A Intel anunciou que seu silício Xe HPC, que ele usa para criar os chips da Ponte Vecchio de 47 ladrilhos com 100 bilhões de transistores , agora está sendo validado para sistemas em ne w implementações multi-GPU. Além disso, a empresa compartilhou que os chips virão em fatores de forma OAM (Open Accelerator Module), confirmando relatórios anteriores . O fator de forma OAM é projetado para uso no ecossistema OCP (Open Compute Platform) e consiste em uma matriz de GPU montada em uma portadora que é então conectada à placa-mãe através de um conector mezanino. Esse tipo de arranjo é semelhante ao fator de forma SXM da Nvidia . Esses tipos de pacotes de chips são muito mais comuns em servidores do que adicionar-em fatores de forma de placa porque permitem sistemas de resfriamento mais poderosos do que os encontrados em fatores de forma de placa tradicionais, ao mesmo tempo em que fornecem um método otimizado de roteamento de energia para o pacote OAM por meio de um PCB (em oposição ao cabeamento PCIe). Documentos Intel vazados listaram os pacotes OAM da Ponte Vecchio em um pico de 600W , e todos os sinais apontam para pelo menos alguns dos modelos de GPU usando refrigeração líquida. No entanto, é concebível que variantes menos poderosas possam ter opções de resfriamento de ar. A Intel oferecerá nós com quatro ou oito Pacotes OAM instalados, chamados de subsistemas x4 ou x8. Esses nós serão então integrados aos servidores de seus clientes. Atualmente, a Intel está validando esses designs de várias GPUs. As primeiras GPUs da Ponte Vecchio aparecerão no supercomputador Aurora , mas esse sistema exascale foi adiado várias vezes (seis anos e contando), com a última chegando pelas mãos dos atrasos de 7 nm da Intel que resultaram em 16 das telhas de computação da Ponte Vecchio sendo produzidas pela TSMC. Você pode ler mais sobre o design aqui . A Intel confirmou que o Aurora não usa os fatores de forma x4 ou x8 descritos acima-cada lâmina Aurora consistirá em seis GPUs Ponte Vecchio emparelhadas com duas CPUs Sapphire Rapids (proporção 6: 1). A Intel também conquistou outra vitória da Ponte Vecchio com o supercomputador SuperMUC-NG em München, Alemanha . Este sistema terá 240 novos nós com Ponte Vecchio emparelhado com Sapphire Rapids, mas não está claro se eles usam os trenós x4 ou x8. Fatores de forma do Intel Ponte Vecchio OAM