As GPUs NVIDIA Ada têm uma contagem de ROP significativamente maior

A NVIDIA está esclarecendo as especificações da série RTX 40.

A empresa divulgou informações completas sobre os tamanhos de matrizes e contagens de transistores nas GPUs AD102, AD103 e AD104. Todos os três devem ser lançados nas próximas semanas. A NVIDIA já forneceu números importantes para a GPU AD102, o principal processador destinado à placa de vídeo RTX 4090, mas os detalhes sobre AD104 e AD103 ainda estavam faltando. Ryan Smith da AnandTech relata sobre os números exatos:

AD102: 608 mm² die , transistores de 76,3B AD103: matriz de 378,6 mm², transistores de 45,9B AD104: matriz de 294,5 mm², transistores de 35,8B

O que isso significa é que todos os três xtor densidade maior que 121M por mm quadrado (na verdade, é idêntico para AD103 e AD104). Além disso, o AD104 com transistores de 35,8B significa que possui transistores de 7,5B a mais do que o carro-chefe da GPU Ampere GA102 (28,3B). Para colocar isso em perspectiva, o GA102 é duas vezes maior que o AD104.

NVIDIA Ada GPUsVideoCardz.comAD102AD103AD104ArquiteturaAda LovelaceAda LovelaceAda LovelaceNó de processoTSMC 4N (5nm)TSMC 4N (5nm)TSMC 4N (5nm)Transistores76.3B45. 9B35.8BDie Size608 mm²378.6 mm²294.5 mm²Transistor Density125.5M121.1M121.1MStreaming Multiprocessors1448060CUDA Cores18432102407680Tensor Cores576320240RT Cores1448060ROPs19211280L2 Cache96MB64MB48MBSKURTX 4090RTX 4080 16GBRTX 4080 12GB

NVIDIA Ada GPUs have a much higher count of Render Output Unit (ROP) que o antecessor, chegando a 192 ROPs para AD102. A GPU AD103 tem tantos ROPs quanto o GA102 (112), enquanto o AD104 tinha 80. Uma contagem de ROP mais alta deve melhorar o desempenho da rasterização.

A NVIDIA introduziu algumas alterações na arquitetura, como a remoção do NVLink, como explicado, para abrir espaço para outros blocos lógicos. Mas, ao mesmo tempo, o cache L2 aumentou significativamente. A NVIDIA agora confirmou o tamanho exato de cada SKU: AD102 96 MB, AD103 64 MB e AD104 48 MB. Confirma-se que ambos os modelos RTX 4080 têm cache L2 totalmente desbloqueado nas respectivas GPUs, então 4080 16GB tem 64MB enquanto 4080 12GB vem com 48MB.

Além disso, HKEPC relata que a NVIDIA também esclareceu o que TSMC 4N realmente significa, que não deve ser confundido com N4. Este processo é um die shrink do processo TSMC 5N, mas ainda é uma arquitetura de 5 nm. O único problema com esse’esclarecimento’é que a própria NVIDIA fornece informações erradas sobre o processo de 4 nm, conforme mostrado abaixo (slide do Editors Day desta semana).

GPUs NVIDIA ADA, Fonte: NVIDIA

Fonte: Ryan Smith (AnandTech), HKEPC

Categories: IT Info