A Cerebras Systems revelou o maior chip AI baseado no nó de processo de 7 nm, o Wafer Scale Engine 2. Sucessando a primeira geração do WSE, o WSE2 é um chip monolítico singular que apresenta uma gama de novos recursos, incluindo a maior contagem de transistores e maior número de núcleos já apresentados em um chip.
O mecanismo de escala de wafer da Cerebras é um chip de IA enorme com 2,6 trilhões de transistores e quase 1 milhão de núcleos
O Cerberas Wafer Scale Engine 2 tem duas partes, a primeira é o próprio chip e a segunda é o sistema CS-2 no qual ele será apresentado. Faremos com o próprio chip, que tem números insanos para seguir. Para começar, o WSE-2 é o maior chip AI já feito. Ele é baseado no nó de processo de 7 nm da TSMC e tem uma taxa de rendimento de 100%, o que é bastante impressionante. Por um lado, se você estiver usando o wafer inteiro como um molde, você obterá 100% de rendimento se o projeto puder absorver defeitos ou 0% se não puder.
Chegando aos detalhes técnicos, o Cerebras WSE-2 mede 46.225 mm2, que é 56 vezes maior do que o maior GPU já feito, o NVIDIA Ampere A100. O chip possui quase um milhão de núcleos (850.000 para ser preciso), um aumento de 123x em relação ao Ampere A100, 40 GB de memória on-chip (SRAM) vs 40 MB no Ampere A100, 20 Petabytes por segundo de largura de banda de memória e 220 Petabits por segundo de largura de banda da malha de interconexão (malha 2D).
Especificações do mecanismo de escala de wafer 2 da Cerebras
Nome do chip | Cerebras WSE-2 | Cerebras WSE-1 | NVIDIA A100 | Cerebras Advantage (vs A100) |
---|---|---|---|---|
Nó de processo | TSMC 7nm | TSMC 16nm | TSMC 7nm | N/A |
Tamanho do chip | 46.225 mm2 | 46.225 mm2 | 826mm2 | 56 X |
Núcleos | 850.000 | 400.000 | 6.912 + 432 | 123 X |
Memória On-Chip | 40 GB | 18 GB | 40 MB | 1.000 X |
Largura de banda da memória | 20 PB/s | 9 PB/s | 1,55 GB/s | 12.862 X |
Largura de banda do tecido | 220 Pb/s | 100 Pb/s | 600 GB/s | 45.833 X |
Preço | TBC | ~ US $ 2 milhões | US $ 11-$ 15K US | N/A |
Quanto aos núcleos do Cerebras WSE-2, eles são núcleos Sparse Linear Algebra Compute (SLAC) otimizados para AI e são ajustados para o processamento de AI. Em comparação com a geração anterior ( Cerebras WSE-1 ), o WSE-2 da Cerebras oferece um aumento de 2,16x na densidade do transistor e apresenta mais de duas vezes o número de núcleos.
O WSE-2 irá alimentar o Cerebras CS-2, o computador de IA da empresa, que mais do que duplica o desempenho do CS-1 de primeira geração da Cerebras. Fabricado pela Taiwan Semiconductor Manufacturing Company (TSMC) em seu nó de 7 nm, o WSE-2 mais do que dobra todas as características de desempenho do chip-contagem de transistores, contagem de núcleos, memória, largura de banda de memória e largura de banda de tecido-em relação à primeira geração WSE.
“A TSMC tem uma longa parceria com os inovadores da indústria para fabricar processadores avançados com desempenho líder. Estamos satisfeitos com o resultado de nossa colaboração contínua com a Cerebras Systems na fabricação do Cerebras WSE-2 em nosso processo de 7 nm, outra conquista e marco extraordinário para o desenvolvimento de escala de wafer após a introdução do Cerebras 16nm WSE há menos de dois anos.”
Sajiv Dalal, vice-presidente sênior de gerenciamento de negócios, TSMC América do Norte
Passando para o sistema Cerebras WSE-2 motorizado CS-2, estamos olhando para um sistema de 26″de altura e composto por 15 unidades de rack (15U). O sistema possui 12 pistas de 100 GbE, um sistema refrigerado a água personalizado solução através de uma configuração de circuito fechado e doze PSUs padrão em uma configuração redundante 9 + 3 que fornece até 23.000 Watts de energia para o sistema CS-2. Algumas palavras da Cerebras sobre sua solução de resfriamento:
Para fornecer a potência de resfriamento de que o WSE-2 precisa e, ao mesmo tempo, manter a integração do datacenter simples, o CS-2 é resfriado internamente por água. A água circula por um circuito fechado, totalmente autocontido no sistema. Como um PC de jogos gigante, o CS-2 usa água para resfriar o WSE-2 e ar para resfriar a água.
O canto superior direito do sistema é para o movimento da água. Duas bombas que podem ser trocadas a quente movem a água por um coletor na parte traseira do WSE-2, resfriando o wafer e aquecendo a água. Água quente é então bombeada para um trocador de calor. Este trocador de calor apresenta uma grande área de superfície para o ar frio soprado pelos quatro ventiladores hot-swappable na parte inferior do CS-2. Esses ventiladores movem o ar do corredor frio, resfriam a água quente por meio do trocador de calor e liberam o ar quente no corredor quente.
Atualmente, não há informações sobre o preço do Cerberas CS-2 ou do WSE-2, mas a primeira geração do Wafer Scale Engine custava cerca de US $ 2 milhões.
A postagem Cerebras Revela seu mecanismo 2 de escala de wafer de 7 nm: o maior chip AI já construído com 2,6 trilhões de transistores e quase um milhão de núcleos por Hassan Mujtaba apareceu primeiro em Wccftech .