DDR4 SDRAM
DDR4 er en efterfølger til DDR3 med højere hastighed og lavere spænding og er blevet accepteret som den nuværende mainstream-standard, da mange processorer/platforme såsom Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99 og de kommende Skylake-X og Ryzen har indført DDR4. Ligesom en CPU er DDR4 bygget til at håndtere et bombardement af små opgaver med lav latenstid og en vis granularitet. DDR4 er grundlæggende velegnet til at overføre små datamængder hurtigt (forholdsmæssigt set) på bekostning af den samlede båndbredde. DDR4-busbredden er 64 bit pr. kanal, men er kombinatorisk; dvs. 128 bit busbredde i dual channel. Desuden har DDR4 en prefetch-bufferstørrelse på 8n (otte dataord pr. hukommelsesadgang), hvilket betyder, at 8 på hinanden følgende dataord (ord kan være mellem 8-64 bit) kan læses og på forhånd placeres i I/O-bufferen. Desuden er I/O-grænsefladen begrænset til en læsning (output fra hukommelsen) eller en skrivning (input til hukommelsen) pr. clockcyklus, men ikke begge dele. Nedenfor vil vi diskutere, hvordan disse specifikationer står i kontrast til GDDR5.
GDDR5 SGRAM
GDDR5 er i øjeblikket den mest almindelige grafikhukommelse blandt de sidste par generationer af GPU’er, men den nyeste version er GDDR5X, og den er i øjeblikket kun implementeret på to kort: GTX GeForce 1080 og Titan X (snart 1080 Ti). Værd at nævne er HBM (High-Bandwidth Memory), der anvendes i nogle af AMD’s high-end Fiji GPU’er fra AMD. HBM 2 blev ratificeret af JEDEC i januar 2016 og anvendes i nVidia Tesla P100 og vil formentlig blive anvendt i de avancerede Vega-baserede GPU’er fra AMD.
GDDR5 er specielt udviklet til båndbredde; f.eks. til at flytte store datastumper ind og ud af framebufferen med den højest mulige gennemstrømning. Dette muliggøres af en meget bredere bus – alt fra 256 til 512 bit på tværs af 4-8 kanaler. Det sker dog på bekostning af øget latenstid via meget løsere interne timings i forhold til DDR4. Latency er ikke helt et problem med GPU’er, da deres parallelle natur gør det muligt for dem at bevæge sig over flere beregninger samtidig. Selv om GDDR5 har den samme prefetch-bufferstørrelse som DDR4 på 8n, overgår den nyeste GDDR5X-standard dette med en dybde på 16n (16 dataord pr. hukommelsesadgang). Desuden kan GDDR håndtere input og output på den samme clockcyklus i modsætning til DDR. Desuden opererer GDDR5 ved en lavere spænding end DDR4 på omkring ~1V, hvilket betyder mindre varmespild og moduler med højere ydeevne. I små pakker, der er pakket tæt sammen, som f.eks. på et grafikkort PCB, er lavere varme afgørende. Systemhukommelse har hele stickens overflade til at sprede sig og er isoleret fra komponenter med høj varme (som GPU’en).
Evolution
DDR SDRAM oplever ikke den eksponentielle vækst, som dens grafikbaserede modstykker oplever. Arbejdet med DDR4 begyndte omkring 2005, men det kom ikke på markedet før 2014. DDR3 blev lanceret i 2007 og anvendes stadig i vid udstrækning i dag.
Den lange gestationsperiode kan tilskrives et par faktorer. For det første har RAM-leverandørerne en tendens til at konkurrere mere på et prisgrundlag end på et ydelsesgrundlag. RAM er blevet til en handelsvare. Desuden er RAM-industrien ikke underkuet af kun to konkurrenter, der konstant forsøger at overgå hinanden. For det andet udvikles og ratificeres nye hukommelsesstandarder af JEDEC-standardiseringsorganet, som består af alle hukommelsesproducenter i verden, der drøfter nye standarder. Endelig skriger hukommelsesindustrien, hvad angår pc’er, ikke ligefrem efter større båndbredde – i dag er RAM sjældent en flaskehals i desktop-pc’er med høj ydeevne.
Der er mange flere katalysatorer for generationsvækst med hensyn til CPU’er og GPU’er, hvor udviklingen i høj grad drives frem af en eller to store producenter, der konkurrerer om markedsandele. Desuden er der med fremkomsten af GPGPU-pipeline (General Purpose Computing on Graphics Processing Units) tale om, at GPU-accelereret databehandling bliver mainstream. Det betyder, at kraftige GPU’er ikke længere kun er ønskværdige for gamere, idet efterspørgslen vokser inden for flere forskellige computerdomæner. Kapløbet om avanceret hardware og teknologi er således fortsat voldsomt, da der er behov for flere computerhestekræfter til AI, deep learning, avanceret billedbehandling, finansiel modellering, datacentre osv.
Slutning
Selv om både DDR4 og GDDR5 deler kerneteknologier, er den ene ikke i sig selv bedre end den anden; de er begge effektivt udstyret til at tjene forskellige formål. Der er få differentiatorer, der spiller ind – som vi har beskrevet her – men i trivielle vendinger kan det beskrives som latenstid vs. båndbredde. CPU’er er mere afhængige af cache og mere effektive, og deres kerner kører med meget højere taktfrekvens end GPU’ernes. Som sådan behøver CPU’er ikke at få adgang til systemhukommelsen så ofte, men når de gør det, er det vigtigt med lav latenstid. GPU’er er mindre cache-belastede, men har mindre mængder af meget hurtigere hukommelse, så der kan typisk tilgås meget hurtigere til den. Som sådan bliver høje beregningsfunktioner, hvor gennemløb er afgørende, overladt til grafikkortet og dets VRAM.
Redaktionelt indlæg: Eric Hamilton