Sitio web El sueño de Coelacanth ubicó una confirmación de Github que puede indicar una configuración futura para el acelerador Instinct basado en GPU AMD Aldebaran que se aproxima. La nueva GPU, con nombre en código’GFX90A,”utilizará la arquitectura CDNA2, un derivado de la estructura GFX 9th Family (estructura Vega).

AMD Instinct MI200 podría incluir dos matrices de GPU CDNA 2 de 110 unidades de cómputo

Hay tres códigos, GFX906_60, GFX908_120 y GFX90A_110, cada uno específico para una fuente diferente. Se especula que el GFX906_60 se refiere al Instinct MI60, el GFX908_120 es el Instinct MI100 y el GFX90A_110 se puede utilizar para el acelerador AMD de última generación. Con cada código, la tercera parte se refiere a unidades computacionales.

CPU AMD Zen + y Zen 2 vulnerables a ataques cibernéticos similares a Meltdown

Por ejemplo, el El MI60 utilizará 60 unidades de cómputo, el MI100 usará 120 unidades y la última es utilizar 110 unidades de cómputo. Lo interesante es que el acelerador de próxima generación de AMD usa menos unidades de cómputo que el MI100.

Fuente: VideoC ardz

Se afirma que la GPU Aldebaran exhibirá 128 unidades de cómputo, lo que no coincide con la información recibida sobre el código de próxima generación para el nuevo acelerador AMD. Sin embargo, cualquier GPU normalmente desactivará algunos de los clústeres, que si esto es correcto, los reduciría a 110 unidades de cómputo activas.

Teniendo en cuenta la configuración de diferentes Shader Engine y CU, Aldebaran/MI200 es una configuración MCM con 2 matrices de GPU, por lo que si la configuración es simétrica para cada matriz en lugar de Shader Engine, cada matriz tendrá 4 SE. Es posible tener (56 CU) y deshabilitar cada una de ellas para hacer un total de 110 CU.

-El sueño de Coelacanth

Estados de VideoCardz del sitio web,

No está claro si AMD planea duplicar el recuento de núcleos FP32 en la arquitectura CDNA2, pero suponiendo que lo hagan, con un reloj de GPU teórico de 1500 MHz, el acelerador ofrecería un rendimiento de cómputo de precisión simple de 42,2 TFLOPS, 1,82 veces más que MI100. Si ese no es el caso, entonces MI200 tendría que tener al menos un reloj de 1650 MHz para alcanzar el mismo rendimiento FP32 de 23 TFLOP.

En el caso de aceleradores HPC como MI200, el rendimiento FP64 es mucho más importante. Según las filtraciones anteriores, MI200 contará con un rendimiento FP64 de velocidad completa, lo que significa duplicar o cuadriplicar el rendimiento sobre MI100, según la arquitectura.

El MI200 de AMD se lanzará antes del lanzamiento finales de 2021. Es su revolucionario procesador de gráficos multichip que está construido con dos matrices activas y 128 gigabytes de memoria HBM2e.

Se rumorea que la tarjeta gráfica AMD Radeon RX 6900 XTX presentará una memoria GDDR6 de 18 Gbps, aumentada Velocidades de reloj con GPU Navi 21 XTXH, más rápido que RTX 3090

Esto es lo que puede esperar del acelerador de GPU AMD Instinct MI200’CDNA 2′

Dentro del AMD Instinct MI200 hay una GPU Aldebaran que incluye dos matrices, una secundaria y una primaria. Tiene dos matrices, cada una de las cuales consta de 8 motores de sombreado para un total de 16 SE. Cada Shader Engine incluye 16 CU con FP64 de velocidad completa, FP32 empaquetado y un motor de matriz de segunda generación para operaciones FP16 y BF16. Cada dado, como tal, está compuesto por 128 unidades de cómputo o 8192 procesadores de flujo. Esto redondea a un total de 220 unidades de cómputo o 14.080 procesadores de flujo para todo el chip. La GPU Aldebaran también funciona con una nueva interconexión XGMI. Cada chiplet cuenta con un motor VCN 2.6 y el controlador IO principal.

El diagrama de bloques de la GPU Aldebaran con CDNA 2 de AMD que alimentará el acelerador Instinct MI200 HPC ha sido visualizado. (Créditos de imagen: Locuza)

En cuanto a DRAM, AMD ha optado por una interfaz de 8 canales que consta de interfaces de 1024 bits para una interfaz de bus de 8192 bits de ancho. Cada interfaz puede admitir módulos DRAM HBM2e de 2 GB. Esto debería darnos hasta 16 GB de capacidad de memoria HBM2e por pila y, dado que hay ocho pilas en total, la cantidad total de capacidad sería la friolera de 128 GB. Eso es 48 GB más que el A100 que alberga 80 GB de memoria HBM2e. La visualización completa de la GPU Aldebaran en el Instinct MI200 está disponible aquí.

Aceleradores AMD Radeon Instinct 2020

Nombre del aceleradorAMD Radeon Instinct MI6AMD Radeon Instinct MI8AMD Radeon Instinct MI25AMD Radeon Instinct MI50AMD Radeon Instinct MI60AMD Instinct MI100AMD Instinct MI200 Arquitectura de GPU Polaris 10Fiji XTVega 10Vega 20Vega 20Arcturus (CDNA 1) Aldebaran (CDNA 2) Nodo de proceso de GPU14nm FinFET28nm14nm FinFET7nm FinFET7nm FinFET7nm FinFET44096? Velocidad de reloj de la GPU1237 MHz1000 MHz1500 MHz1725 MHz1800 MHz ~ 1500 MHzTBA FP16 Computación5.7 TFLOPs8.2 TFLOPs24.6 TFLOPs26.5 TFLOPs29.5 TFLOPs185 TFLOPsTBA FP32 Compute5.7 TFLOPs8.2 TFLOPs12.3 TFLOPs13.3 TFLOPs23.1 TFL64s Compute384 GFLOPs512 GFLOPs768 GFLOPs6.6 TFLOPs7.4 TFLOPs11.5 TFLOPsTBA VRAM16 GB GDDR54 GB HBM116 GB HBM216 GB HBM232 GB HBM232 GB HBM264/128 GB HBM2e? Reloj de memoria1750 MHz500 MHz945 MHz1000 MHz1000 MHz1200 MHzTBA Bus de memoria Bus de 256 bits Bus de 4096 bits Bus de 2048 bits Bus de 4096 bits Bus de 4096 bits Bus de 4096 bits Ancho de banda de memoria de 8192 bits224 GB/s512 GB/s484 GB/s1 TB/s1 TB/s1,23 TB/s ~ 2 TB/s? Factor de forma Ranura única, Longitud completa Ranura doble, Longitud media Ranura doble, Longitud completa Ranura doble, Longitud completa Ranura doble, Longitud completa Ranura doble, Longitud completa Ranura doble, Longitud total/OAM Enfriamiento Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo Enfriamiento pasivo VideoCardz, ROCm Github , Coelacanth’s Dream

Categories: IT Info