Les performances de latence de la mémoire des architectures GPU AMD RDNA 2 d’AMD et Ampere de NVIDIA ont été testées par Chips and Cheese . Le point de vente technique a décidé de tester les performances de latence de la mémoire GPU des dernières architectures GPU de l’équipe rouge et de l’équipe verte et a trouvé des résultats intéressants.

Les GPU RDNA 2 d’AMD présentent des performances de latence de mémoire supérieures à celles de l’architecture GPU Ampere de NVIDIA

Du côté du processeur, la mesure des performances du cache et de la latence est devenue un indicateur crucial avec l’utilisation toujours croissante de puces multi-puces et de plusieurs puces IO à bord du même dé et dans les cas récents, également hors-die (puces AMD Zen ). Les GPU sont également composés de plusieurs hiérarchies de cache qui comblent les lacunes entre les performances de calcul et de mémoire et la source utilise des points de repère basés sur OpenCL pour mesurer les performances de latence du cache et de la mémoire sur la génération actuelle de GPU tels que NVIDIA Ampere et AMD RDNA 2 architectures.

Les APU AMD Van Gogh apportent la puissance de RDNA 2 dans les ordinateurs portables Ryzen ultra-faible consommation, Quad Zen 2 cœurs et jusqu’à 8 unités de calcul Navi

GPU NVIDIA Ampère vs cache GPU AMD RDNA 2 et performances de latence mesurées. (Crédits d’image: chips et fromage)

Dans les benchmarks, l’AMD Radeon RX 6800 XT (GPU RDNA 2) et le NVIDIA GeForce RTX 3090 (GPU Ampère) étaient positionnés l’un contre l’autre. Le benchmark du cache et de la mémoire montre que l’architecture RDNA 2 d’AMD s’est bien mieux comportée que le GPU Ampere de NVIDIA, offrant une latence plus faible malgré la nécessité de vérifier deux niveaux de cache supplémentaires sur le chemin de la mémoire. L’utilisation du cache Infinity n’ajoute que 20 ns par rapport au hit L2 et est toujours plus rapide que l’Ampère de NVIDIA.

La raison invoquée est que le GPU GA102 basé sur NVIDIA Ampere est simplement un GPU beaucoup plus grand et bien qu’il utilise un sous-système de mémoire GPU plus conventionnel avec seulement deux niveaux de cache, il doit prendre beaucoup de cycles et entraîner plus de 100 ns latence (L1 à L2). RDNA 2, quant à lui, a une latence de seulement 66ns. Notez que le GPU AMD Navi 21 est beaucoup plus petit et dispose d’un cache L2 de 4 Mo tandis que le GPU NVIDIA GA102 dispose d’un cache L2 de 6 Mo pour l’ensemble de la puce. Le GPU NVIDIA A100 Ampère pour HPC dispose d’un énorme cache L3 de 40 Mo.

Voici une note sur la performance de Chips and Cheese:

Le cache de RDNA 2 est rapide et il y en a beaucoup. Par rapport à Ampere, la latence est faible à tous les niveaux. Infinity Cache n’ajoute qu’environ 20 ns sur un hit L2 et a une latence inférieure à celle d’Ampere L2. Étonnamment, la latence VRAM de RDNA 2 est à peu près la même que celle d’Ampère, même si RDNA 2 vérifie deux autres niveaux de cache sur le chemin de la mémoire.

En revanche, Nvidia utilise un sous-système de mémoire GPU plus conventionnel avec seulement deux niveaux de cache et une latence L2 élevée. Le passage de la L1 SM-privée d’Ampère à la L2 prend plus de 100 ns. Le L2 de RDNA est à ~ 66 ns de L0, même avec un cache L1 entre eux. Contourner l’énorme dé du GA102 semble prendre beaucoup de cycles.

Cela pourrait expliquer les excellentes performances d’AMD à des résolutions inférieures. Les caches L2 et L3 à faible latence de RDNA 2 peuvent lui donner un avantage avec des charges de travail plus petites, où l’occupation est trop faible pour masquer la latence. Les puces Ampere de Nvidia en comparaison nécessitent plus de parallélisme pour briller.

via Chips and Cheese

Par rapport aux anciennes puces Pascal et Maxwell, l’architecture Ampere a conduit à des vitesses de latence fortement améliorées sur des GPU beaucoup plus grands. AMD, d’autre part, a montré des gains impressionnants par rapport aux anciennes puces basées sur l’architecture GCN et VLIW. Ces chiffres seront certainement intéressants à comparer une fois que la nouvelle série de GPU basés sur des chipsets arrivera sur le segment des jeux dans les années à venir.

Categories: IT Info