Quando se trata de GPUs, a Nvidia perdeu muito pouco em face de um ressurgimento AMD, e isso é possível mantendo consistentemente o domínio tecnológico geração após geração. GPU de jogos topo de linha da Nvidia, o RTX 3090 ainda não foi contestado em seu suporte, e se um rumor recente acontecer, a Nvidia provavelmente continuará a dominar o espaço.
n31: 5nm + 6nm 256 bits gddr6
n32 5nm + 6nm 192 bits gddr6
n33 6nm 128 bits gddr6 perf> 6900xt
ad102 5nm 384 bits gddr6x
ad103?
ad104?
ad106?-Greymon55 (@ greymon55) 19 de setembro de 2021
De acordo com Greymon55 via Wccftech (tendo um registro muito confiável), a GPU AD102 de próxima geração da Nvidia poderia atingir e cruzar a marca de velocidade do clock de 2200 MHz. Se o boato acertar esses números ou estiver perto dos números no lançamento, podemos testemunhar um salto geracional significativo, como aquele provocado pelo Ampere alimentando as placas da série RTX 3000. A GPU de jogos reinante atual, o RTX 3090 aumenta para cerca de no máximo 1700 MHz, então os rumores são certamente um salto significativo em relação à geração anterior.
Alguns rumores anteriores sobre Lovelace também corroboraram o desempenho significativo salto, com 3DCenter especulando as especificações prováveis.
12 unidades de processamento gráfico 72 Texture Processor Clusters 144 Streaming Multiprocessors/18432 Cuda Cores barramento de 384 bits/GDDR6X Memory
Então, o chip AD102 da nVidia talvez seja como:
12 GPC
72 TPC
144 SM
18.432 unidades FP32
~ 66 TFlops FP32 de potência (em 1,8 GHz) https://t.co/A8OnUktE1s-3DCenter.org (@ 3DCenter_org) 28 de dezembro de 2020
Isso pode teoricamente equivale a uma GPU AD102 entregando 66,4 TFLOPs (FP32) insanos. Colocando isso em contexto, o RTX 3090 atinge o máximo em cerca de 36 TFLOPs. Além disso, o rumor anterior assumia velocidades de clock de 1,8 GHz, então depois de calcular o novo número a partir das informações recentes, o desempenho de computação de ponto flutuante revisado atinge um número ainda mais ridículo de 81 TFLOPs . Isso pode se traduzir na GPU AD102 sendo mais de duas vezes mais rápida do que um RTX 3090 em cálculos de ponto flutuante.
Como Wccftech corretamente apontou, as pontuações de computação FP32 não escalam linearmente com o desempenho da vida real e o real os ganhos são significativamente menores. Rumores também sugerem que a GPU “AD102” manterá a largura do barramento de 384 bits com memória GDDR6X, semelhante ao RTX 3090. Isso é esperado porque o GDDR6X já fornece uma quantidade significativa de largura de banda ( Mais de 40% de aumento de GDDR6 ), e muito provavelmente não será um ponto de gargalo em um caso de uso pretendido cenário.
Isso contrasta com a TSMC, que anunciou uma melhoria de densidade de 1.8x e uma melhoria de desempenho de 15% ou energia 30% menor.
A TSMC anunciou uma melhoria de densidade muito maior do que a Samsung. Acredito que a TSMC terá uma vantagem significativa de densidade sobre a Samsung a 5 nm.
-Scotten Jones (SemiWiki)
Outro aspecto interessante da arquitetura Ada Lovelace de última geração é seu suposto nó de 5nm , e de acordo com a Wccftech, isso será assumido pela TSMC desta vez em vez da Samsung . Isso pode ser surpreendente por duas razões, em primeiro lugar porque o 5nm da TSMC tem muita demanda e já está funcionando em plena capacidade e, em segundo lugar, a Samsung já fabrica GPUs Ampere para Nvidia, e agora com seu novo nó de 5nm, esperava-se que a Samsung fosse a Pioneiros para a próxima geração de GPUs Nvidia.
Embora isso seja atribuído ao processo superior de 5nm da TSMC, que é dito ser mais denso do que o próprio nó de 5nm da Samsung, levando a melhores ganhos de desempenho e menor consumo de energia. Mais uma vez, com as restrições de produção da TSMC, é provável que a Nvidia use a fundição taiwanesa exclusivamente para placas de última geração, e o resto irá para a Samsung para produção de volume, onde um nó de última geração não é necessário. A linha de Ada Lovelace da Nvidia ainda está longe, provavelmente no final de 2022, então considere as informações aqui como especulação, pelo menos até que tenhamos informações mais concretas perto do lançamento.