Cerebras Wafer Scale Engine 2 maior chip AI

A Cerebras Systems revelou o maior chip AI baseado no nó de processo de 7 nm, o Wafer Scale Engine 2. Sucessando a primeira geração do WSE, o WSE2 é um chip monolítico singular que apresenta uma gama de novos recursos, incluindo a maior contagem de transistores e maior número de núcleos já apresentados em um chip.

O mecanismo de escala de wafer da Cerebras é um chip de IA enorme com 2,6 trilhões de transistores e quase 1 milhão de núcleos

O Cerberas Wafer Scale Engine 2 tem duas partes, a primeira é o próprio chip e a segunda é o sistema CS-2 no qual ele será apresentado. Faremos com o próprio chip, que tem números insanos para seguir. Para começar, o WSE-2 é o maior chip AI já feito. Ele é baseado no nó de processo de 7 nm da TSMC e tem uma taxa de rendimento de 100%, o que é bastante impressionante. Por um lado, se você estiver usando o wafer inteiro como um molde, você obterá 100% de rendimento se o projeto puder absorver defeitos ou 0% se não puder.

O chip Cerebras Wafer Scale Engine é comparado ao GPU AI A100 da NVIDIA.

Chegando aos detalhes técnicos, o Cerebras WSE-2 mede 46.225 mm2, que é 56 vezes maior do que o maior GPU já feito, o NVIDIA Ampere A100. O chip possui quase um milhão de núcleos (850.000 para ser preciso), um aumento de 123x em relação ao Ampere A100, 40 GB de memória on-chip (SRAM) vs 40 MB no Ampere A100, 20 Petabytes por segundo de largura de banda de memória e 220 Petabits por segundo de largura de banda da malha de interconexão (malha 2D).

Especificações do mecanismo de escala de wafer 2 da Cerebras

Nome do chip Cerebras WSE-2 Cerebras WSE-1 NVIDIA A100 Cerebras Advantage (vs A100)
Nó de processo TSMC 7nm TSMC 16nm TSMC 7nm N/A
Tamanho do chip 46.225 mm2 46.225 mm2 826mm2 56 X
Núcleos 850.000 400.000 6.912 + 432 123 X
Memória On-Chip 40 GB 18 GB 40 MB 1.000 X
Largura de banda da memória 20 PB/s 9 PB/s 1,55 GB/s 12.862 X
Largura de banda do tecido 220 Pb/s 100 Pb/s 600 GB/s 45.833 X
Preço TBC ~ US $ 2 milhões US $ 11-$ 15K US N/A

Quanto aos núcleos do Cerebras WSE-2, eles são núcleos Sparse Linear Algebra Compute (SLAC) otimizados para AI e são ajustados para o processamento de AI. Em comparação com a geração anterior ( Cerebras WSE-1 ), o WSE-2 da Cerebras oferece um aumento de 2,16x na densidade do transistor e apresenta mais de duas vezes o número de núcleos.

O WSE-2 irá alimentar o Cerebras CS-2, o computador de IA da empresa, que mais do que duplica o desempenho do CS-1 de primeira geração da Cerebras. Fabricado pela Taiwan Semiconductor Manufacturing Company (TSMC) em seu nó de 7 nm, o WSE-2 mais do que dobra todas as características de desempenho do chip-contagem de transistores, contagem de núcleos, memória, largura de banda de memória e largura de banda de tecido-em relação à primeira geração WSE.

Cerebras

“A TSMC tem uma longa parceria com os inovadores da indústria para fabricar processadores avançados com desempenho líder. Estamos satisfeitos com o resultado de nossa colaboração contínua com a Cerebras Systems na fabricação do Cerebras WSE-2 em nosso processo de 7 nm, outra conquista e marco extraordinário para o desenvolvimento de escala de wafer após a introdução do Cerebras 16nm WSE há menos de dois anos.”

Sajiv Dalal, vice-presidente sênior de gerenciamento de negócios, TSMC América do Norte

Passando para o sistema Cerebras WSE-2 motorizado CS-2, estamos olhando para um sistema de 26″de altura e composto por 15 unidades de rack (15U). O sistema possui 12 pistas de 100 GbE, um sistema refrigerado a água personalizado solução através de uma configuração de circuito fechado e doze PSUs padrão em uma configuração redundante 9 + 3 que fornece até 23.000 Watts de energia para o sistema CS-2. Algumas palavras da Cerebras sobre sua solução de resfriamento:

Para fornecer a potência de resfriamento de que o WSE-2 precisa e, ao mesmo tempo, manter a integração do datacenter simples, o CS-2 é resfriado internamente por água. A água circula por um circuito fechado, totalmente autocontido no sistema. Como um PC de jogos gigante, o CS-2 usa água para resfriar o WSE-2 e ar para resfriar a água.

O canto superior direito do sistema é para o movimento da água. Duas bombas que podem ser trocadas a quente movem a água por um coletor na parte traseira do WSE-2, resfriando o wafer e aquecendo a água. Água quente é então bombeada para um trocador de calor. Este trocador de calor apresenta uma grande área de superfície para o ar frio soprado pelos quatro ventiladores hot-swappable na parte inferior do CS-2. Esses ventiladores movem o ar do corredor frio, resfriam a água quente por meio do trocador de calor e liberam o ar quente no corredor quente.

Atualmente, não há informações sobre o preço do Cerberas CS-2 ou do WSE-2, mas a primeira geração do Wafer Scale Engine custava cerca de US $ 2 milhões.

A postagem Cerebras Revela seu mecanismo 2 de escala de wafer de 7 nm: o maior chip AI já construído com 2,6 trilhões de transistores e quase um milhão de núcleos por Hassan Mujtaba apareceu primeiro em Wccftech .

Source link

Categories: Wordpress