DDR4 SDRAM
Als Nachfolger von DDR3 mit höherer Geschwindigkeit und niedrigerer Spannung hat sich DDR4 als aktueller Mainstream-Standard durchgesetzt, da viele Prozessoren/Plattformen wie Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99 und die kommenden Skylake-X und Ryzen DDR4 übernommen haben. Ähnlich wie eine CPU ist DDR4 darauf ausgelegt, ein Bombardement kleiner Aufgaben mit geringer Latenz und einer gewissen Granularität zu bewältigen. DDR4 ist grundsätzlich dafür geeignet, kleine Datenmengen schnell (vergleichsweise) zu übertragen, was auf Kosten der Gesamtbandbreite geht. Die DDR4-Busbreite beträgt 64 Bit pro Kanal, ist aber kombinierbar, d. h. 128 Bit Busbreite in zwei Kanälen. Außerdem hat DDR4 eine Prefetch-Puffergröße von 8n (acht Datenwörter pro Speicherzugriff), was bedeutet, dass acht aufeinanderfolgende Datenwörter (die zwischen 8 und 64 Bit lang sein können) gelesen und vorausschauend in den E/A-Puffer gelegt werden können. Außerdem ist die E/A-Schnittstelle auf einen Lesevorgang (Ausgabe aus dem Speicher) oder einen Schreibvorgang (Eingabe in den Speicher) pro Taktzyklus beschränkt, aber nicht auf beide. Im Folgenden werden wir erörtern, wie sich diese Spezifikationen von GDDR5 unterscheiden.
GDDR5 SGRAM
GDDR5 ist derzeit der am weitesten verbreitete Grafikspeicher der letzten GPU-Generationen, aber die neueste Version ist GDDR5X, die derzeit nur auf zwei Karten implementiert ist: der GTX GeForce 1080 und Titan X (bald 1080 Ti). Erwähnenswert ist auch HBM (High-Bandwidth Memory), das in einigen der High-End-GPUs Fiji von AMD verwendet wird. HBM 2 wurde von der JEDEC im Januar 2016 ratifiziert und wird in der nVidia Tesla P100 verwendet und wird vermutlich in den High-End-GPUs auf Vega-Basis von AMD zum Einsatz kommen.
GDDR5 wurde speziell für die Bandbreite entwickelt, z. B. für die Übertragung großer Datenmengen in und aus dem Framebuffer mit höchstem Durchsatz. Ermöglicht wird dies durch einen viel breiteren Bus – zwischen 256 und 512 Bit über 4-8 Kanäle. Der Preis dafür ist allerdings eine höhere Latenzzeit, da die internen Timings im Vergleich zu DDR4 viel lockerer sind. Latenz ist bei GPUs kein Problem, da sie aufgrund ihrer parallelen Natur mehrere Berechnungen gleichzeitig durchführen können. Obwohl GDDR5 die gleiche Prefetch-Puffergröße wie DDR4 (8n) hat, übertrifft der neueste GDDR5X-Standard diese mit einer Tiefe von 16n (16 Datenwörter pro Speicherzugriff). Außerdem kann GDDR im Gegensatz zu DDR Ein- und Ausgaben im selben Taktzyklus verarbeiten. Darüber hinaus arbeitet GDDR5 mit einer niedrigeren Spannung als DDR4 (ca. 1 V), was eine geringere Wärmeabgabe und leistungsfähigere Module bedeutet. In kleinen, dicht gepackten Gehäusen, wie auf der Leiterplatte einer Grafikkarte, ist eine geringere Wärmeentwicklung entscheidend. Der Systemspeicher kann sich auf der gesamten Oberfläche des Sticks ausbreiten und ist von Komponenten mit hoher Wärmeentwicklung (wie der GPU) isoliert.
Evolution
DDR-SDRAM erlebt nicht das exponentielle Wachstum, das seine grafikbasierten Gegenstücke erfahren. Die Arbeit an DDR4 begann um 2005, aber es kam erst 2014 auf den Markt. DDR3 wurde 2007 auf den Markt gebracht und ist heute noch weit verbreitet.
Die lange Entwicklungszeit ist auf mehrere Faktoren zurückzuführen. Erstens konkurrieren die RAM-Anbieter eher über den Preis als über die Leistung. RAM ist ein Massenprodukt. Außerdem wird die RAM-Branche nicht von nur zwei Wettbewerbern beherrscht, die ständig versuchen, einander zu überholen. Zweitens werden neue Speicherstandards vom JEDEC-Standardisierungsgremium entwickelt und ratifiziert, in dem alle Speicherhersteller der Welt vertreten sind und über neue Standards beraten. Und schließlich schreit die Speicherindustrie in Bezug auf PCs nicht gerade nach höherer Bandbreite – heutzutage ist der Arbeitsspeicher selten ein Engpass in leistungsstarken Desktop-PCs.
Es gibt viel mehr Katalysatoren für das Wachstum der Generationen in Bezug auf CPUs und GPUs, wo die Entwicklung weitgehend von einem oder zwei großen Herstellern vorangetrieben wird, die um Marktanteile konkurrieren. Darüber hinaus wird mit dem Aufkommen der GPGPU-Pipeline (General Purpose Computing on Graphics Processing Units) das GPU-beschleunigte Rechnen zum Mainstream. Das bedeutet, dass leistungsstarke Grafikprozessoren nicht mehr nur für Gamer interessant sind, sondern dass die Nachfrage in vielen verschiedenen Bereichen steigt. So bleibt der Wettlauf um fortschrittliche Hardware und Technologie ungebremst, da mehr Rechenleistung für KI, Deep Learning, fortschrittliche Bildverarbeitung, Finanzmodellierung, Rechenzentren usw. benötigt wird.
Schlussfolgerung
Während DDR4 und GDDR5 die gleichen Kerntechnologien nutzen, ist die eine nicht von Natur aus besser als die andere; beide sind effektiv für unterschiedliche Zwecke ausgestattet. Es gibt ein paar Unterscheidungsmerkmale, die ins Spiel kommen – wie wir hier beschrieben haben – aber trivial ausgedrückt könnte man es als Latenz vs. Bandbreite beschreiben. CPUs sind mehr auf den Cache angewiesen und effizienter, und ihre Kerne laufen mit einer viel höheren Taktrate als die von GPUs. Daher müssen CPUs nicht so häufig auf den Systemspeicher zugreifen, aber wenn sie dies tun, ist eine niedrige Latenzzeit unerlässlich. GPUs sind weniger cache-lastig, verfügen aber über kleinere Mengen an viel schnellerem Speicher, so dass in der Regel viel schneller auf ihn zugegriffen werden kann. Daher werden rechenintensive Funktionen, bei denen der Durchsatz entscheidend ist, auf die Grafikkarte und ihren VRAM ausgelagert.
Redaktion: Eric Hamilton