DDR4 SDRAM

Successeur à plus haute vitesse et à plus faible tension de la DDR3, la DDR4 a été acceptée comme la norme principale actuelle car de nombreux processeurs/plateformes tels que Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99, et les prochains Skylake-X et Ryzen ont adopté la DDR4. Tout comme un processeur, la DDR4 est construite pour gérer un bombardement de petites tâches avec une faible latence et une certaine granularité. La DDR4 est fondamentalement adaptée au transfert rapide (comparativement) de petites quantités de données, au détriment de la bande passante globale. La largeur de bus de la DDR4 est de 64 bits par canal, mais elle est combinée ; c’est-à-dire que la largeur de bus est de 128 bits en double canal. En outre, la DDR4 possède une taille de tampon de préextraction de 8n (huit mots de données par accès à la mémoire), ce qui signifie que 8 mots de données consécutifs (les mots peuvent être compris entre 8 et 64 bits) peuvent être lus et placés de manière anticipée dans le tampon d’E/S. De plus, l’interface E/S est limitée à une lecture (sortie de la mémoire) ou une écriture (entrée dans la mémoire) par cycle d’horloge, mais pas les deux. Ci-dessous, nous verrons comment ces spécifications contrastent avec la GDDR5.

GDDR5 SGRAM

La GDDR5 est actuellement la mémoire graphique la plus courante parmi les deux dernières générations de GPU, mais la version la plus récente est la GDDR5X, qui n’est actuellement implémentée que sur deux cartes : les GTX GeForce 1080 et Titan X (bientôt, 1080 Ti). Il convient de mentionner la technologie HBM (High-Bandwidth Memory) utilisée dans certains des GPU haut de gamme Fiji d’AMD. HBM 2 a été ratifié par le JEDEC en janvier 2016 et est utilisé dans le nVidia Tesla P100 et sera vraisemblablement utilisé dans les GPU haut de gamme basés sur Vega par AMD.

GDDR5 est conçu spécialement pour la bande passante ; par exemple, le déplacement de gros morceaux de données dans et hors du framebuffer avec le plus haut débit possible. Cela est rendu possible par un bus beaucoup plus large – de 256 à 512 bits sur 4 à 8 canaux. Mais cela se fait au prix d’une augmentation de la latence via des timings internes beaucoup plus lâches que ceux de la DDR4. La latence n’est pas entièrement un problème avec les GPU, car leur nature parallèle leur permet d’effectuer plusieurs calculs simultanément. Bien que la GDDR5 ait la même taille de tampon de préextraction que la DDR4, soit 8n, la toute nouvelle norme GDDR5X la surpasse avec une profondeur de 16n (16 mots de données par accès mémoire). De plus, la GDDR peut gérer l’entrée et la sortie sur le même cycle d’horloge, contrairement à la DDR. En outre, la GDDR5 fonctionne à une tension inférieure à celle de la DDR4, de l’ordre de ~1V, ce qui signifie moins de pertes de chaleur et des modules plus performants. Dans les petits paquets qui sont emballés ensemble de manière dense, comme sur le PCB d’une carte graphique, une chaleur plus faible est essentielle. La mémoire système dispose de toute la surface de la clé pour se répandre, et est isolée des composants à forte chaleur (comme le GPU).

Evolution

La DDR SDRAM ne connaît pas la croissance exponentielle que connaissent ses homologues à base graphique. Les travaux sur la DDR4 ont commencé vers 2005, mais elle n’est arrivée sur le marché qu’en 2014. La DDR3 a été lancée en 2007 et est encore largement utilisée aujourd’hui.

La longue période de gestation peut être attribuée à quelques facteurs. Tout d’abord, les fournisseurs de RAM ont tendance à se concurrencer davantage sur la base des prix, plutôt que sur la base des performances. La RAM est un produit de base. De plus, l’industrie de la RAM n’est pas subjuguée par seulement deux concurrents qui tentent constamment de se dépasser l’un l’autre. Deuxièmement, les nouvelles normes de mémoire sont élaborées et ratifiées par l’organisme de normalisation JEDEC, qui regroupe tous les fabricants de mémoire du monde délibérant sur les nouvelles normes. Enfin, l’industrie de la mémoire, en ce qui concerne les PC, ne réclame pas exactement une bande passante plus large – de nos jours, la RAM est rarement un goulot d’étranglement dans les PC de bureau performants.

Il y a beaucoup plus de catalyseurs pour la croissance générationnelle en ce qui concerne les CPU et les GPU, où le développement est largement stimulé par un ou deux grands fabricants qui se disputent les parts de marché. En outre, l’avènement du pipeline GPGPU (General Purpose Computing on Graphics Processing Units) permet à l’informatique accélérée par les GPU de se généraliser. Cela signifie que les GPU puissants ne sont plus exclusivement destinés aux joueurs, la demande augmentant dans plusieurs domaines informatiques différents. Ainsi, la course au matériel et à la technologie de pointe reste effrénée, car davantage de puissance de calcul est nécessaire pour l’IA, l’apprentissage profond, le traitement d’images avancé, la modélisation financière, les centres de données, etc.

Conclusion

Bien que la DDR4 et la GDDR5 partagent toutes deux des technologies de base, l’une n’est pas intrinsèquement meilleure que l’autre ; elles sont toutes deux efficacement équipées pour servir différents objectifs. Il y a quelques différenciateurs qui entrent en jeu – comme nous l’avons décrit ici – mais en termes triviaux, on pourrait les décrire comme la latence contre la bande passante. Les CPU sont plus efficaces et dépendent davantage du cache, et leurs cœurs fonctionnent à une fréquence d’horloge beaucoup plus élevée que celle des GPU. En tant que tels, les CPU n’ont pas à accéder à la mémoire système aussi fréquemment, mais lorsqu’ils le font, une faible latence est impérative. Les GPU sont moins chargés en cache, mais disposent de plus petites quantités de mémoire beaucoup plus rapide, ce qui permet d’y accéder beaucoup plus rapidement. À ce titre, les fonctions de calcul élevées où le débit est essentiel sont déchargées sur la carte vidéo et sa VRAM.

Éditorial : Eric Hamilton

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.