A Ampere Computing anunciou esta manhã que sua família de processadores AmpereOne entrou em produção e forneceu detalhes adicionais sobre esses processadores de servidor Arm projetados internamente.
Os novos núcleos AmpereOne são um design de núcleo personalizado interno, conforme divulgado anteriormente pela empresa. Ao projetar o AmpereOne diretamente para provedores de serviços em nuvem, o AmpereOne oferece até 192 núcleos físicos por soquete-bem acima dos já impressionantes 128 núcleos atualmente oferecidos pelo Ampere Altra Max.
Fui informado com antecedência sobre o roteiro atualizado da Ampere Computing e enquanto o AmpereOne está em produção e amostras com clientes, Ainda não tive a oportunidade de testar nenhuma plataforma AmpereOne em primeira mão para analisar de forma independente seu desempenho e eficiência de energia. Espero que isso aconteça em breve. Alguns detalhes sobre o AmpereOne ainda são limitados, como nenhuma tabela SKU com velocidades de clock, informações de preços ou disponibilidade por provedores de serviços de nuvem pública foram divulgadas durante o briefing avançado. Conforme previsto, o AmpereOne muda para DDR5 e PCIe Gen 5.0–combinando os recursos dos mais recentes processadores AMD EPYC”Genoa”e Intel Xeon Scalable”Sapphire Rapids”.
Novo com os núcleos personalizados do AmpereOne são Bfloat16, marcação de memória, criptografia de memória de chave única, virtualização segura, gerenciamento de energia aprimorado e uma série de outras melhorias em relação aos processadores Ampere Altra e Ampere Altra Max anteriores.
Um dos aspectos O que mais me surpreendeu com o AmpereOne é que, pelo menos por enquanto, eles estão limitando-o a contagens de núcleos mais altas não cobertas pelo Ampere Altra/Altra Max. Em outras palavras, AmpereOne é para contagens de 136/144/160/176/192 núcleos… Não há atualmente nenhum processador AmpereOne planejado para 128 núcleos ou menos atualmente coberto pela família Ampere Altra. Presumivelmente, isso se deve à grande aposta em direcionar os novos processadores diretamente para provedores de serviços em nuvem interessados em maximizar a densidade de VM. Eu perguntei sobre a possibilidade de um processador de desenvolvedor AmpereOne com menor número de núcleos ou para aqueles que desejam menos núcleos, mas estão interessados no AmpereOne para BFloat16 ou outros novos recursos encontrados com esses novos processadores, mas atualmente eles não têm nenhum produto planejado neste segmento. Em outras palavras, vá grande ou vá para casa.
No topo, com o AmpereOne em 192 contagens de núcleo, está em torno de um relatório de consumo de energia de 350 Watts. O AmpereOne usa 8 canais de memória DDR5 como Intel Sapphire Rapids, mas abaixo do DDR5 de 12 canais desfrutado pelo AMD Genoa.
O núcleo personalizado do Ampere apresenta cache de dados L1 de 4 vias de 64 KB por núcleo, cache de instrução L1 de 16 KB por núcleo e um cache L2 de 2 MB por núcleo. Diz-se que houve ganhos de eficiência de energia, presumivelmente em parte devido à atualização no processo de fabricação TSMC, mas os detalhes exatos não foram definidos.
Ampere Computing está relatando muito mais VMs possível por rack com o AmpereOne, para o qual eles estão baseando sua avaliação apenas no número de núcleos de CPU físicos possíveis e uma VM por núcleo físico. Portanto, esta afirmação é bastante duvidosa apenas relatando o número máximo de núcleos por rack possível sem qualquer potencial de energia/desempenho das referidas VMs.
Os benchmarks iniciais fornecidos pela Ampere para O AmpereOne é bastante limitado: uma referência de difusão estável para IA generativa e, em seguida, usando DLRM para recomendações de IA. O AmpereOne supostamente oferece 2,3 vezes mais quadros por segundo do que um AMD EPYC 9654″Genoa”e mais que o dobro do número de consultas por segundo para DLRM do que o EPYC 9654. Infelizmente, esses dois benchmarks de desempenho de IA são tudo o que é mostrado nos anúncios de hoje.
Um item que é importante destacar foi ao passar pelas notas finais de sua apresentação, com o benchmark DLRM eles estão testando AmpereOne usando FP16 enquanto para AMD EPYC 9654 foi testado usando FP32. AmpereOne viu uma média de energia do sistema durante DLRM em 534 Watts para AMD EPYC Genoa 9654 em 512 Watts.
Ampere Computing encerrou seu briefing mostrando sua ampla gama de parceiros de fornecedores de hardware como Giga Computing, Foxconn, HPE e Supermicro para nuvens públicas como Microsoft Azure, Tencent Cloud, Google Cloud e outras. Isso é indicativo de seus parceiros atuais e nenhuma palavra ainda quando veremos qualquer hardware AmpereOne ou começaremos a ver esses 192 processadores de servidor núcleo na nuvem pública.
Disseram-me durante meu briefing de que, graças ao upstreaming inicial do kernel, além de já ter o suporte do compilador para GCC e LLVM Clang, as principais distribuições Linux AArch64 devem estar prontas para execução no AmpereOne. Esses patches de compilador anteriores confirmaram que o AmpereOne é baseado no ARMv8.6 ISA.
É isso por enquanto com as informações da divulgação do roteiro de hoje da Ampere Computing. Esperamos que em breve possamos testar o hardware AmpereOne para fornecer uma visão independente de seu desempenho e eficiência de energia em uma ampla variedade de benchmarks.