DDR4 SDRAM
DDR4 är en efterföljare till DDR3 med högre hastighet och lägre spänning, och DDR4 har accepterats som den nuvarande mainstream-standarden eftersom många processorer/plattformar, t.ex. Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99 och de kommande Skylake-X och Ryzen, har antagit DDR4. Precis som en CPU är DDR4 byggd för att hantera ett bombardemang av små uppgifter med låg latenstid och en viss granularitet. DDR4 lämpar sig i grunden för att överföra små datamängder snabbt (jämförelsevis), på bekostnad av den samlade bandbredden. DDR4:s bussbredd är 64 bitar per kanal, men är kombinerad, dvs. 128 bitar bussbredd i dubbla kanaler. DDR4 har dessutom en prefetchbuffertstorlek på 8n (åtta datavord per minnesåtkomst), vilket innebär att åtta på varandra följande datavord (ord kan vara mellan 8-64 bitar) kan läsas och placeras i förväg i I/O-bufferten. I/O-gränssnittet är också begränsat till en läsning (utmatning från minnet) eller en skrivning (inmatning till minnet) per klockcykel, men inte båda. Nedan diskuterar vi hur dessa specifikationer står i kontrast till GDDR5.
GDDR5 SGRAM
GDDR5 är för närvarande det vanligaste grafikminnet bland de senaste generationerna av grafikkort, men den nyaste versionen är GDDR5X, som för närvarande bara är implementerad på två kort: GTX GeForce 1080 och Titan X (snart 1080 Ti). Värt att nämna är HBM (High-Bandwidth Memory) som används i vissa av AMD:s avancerade Fiji GPU:er. HBM 2 ratificerades av JEDEC i januari 2016 och används i nVidia Tesla P100 och kommer förmodligen att användas i AMD:s avancerade Vega-baserade GPU:er.
GDDR5 är specialbyggt för bandbredd, t.ex. för att flytta massiva dataklumpar in och ut ur rambufferten med högsta möjliga genomströmning. Detta möjliggörs av en mycket bredare buss – från 256 till 512 bitar i 4-8 kanaler. Det sker dock till priset av ökad latenstid via mycket lösare interna timings jämfört med DDR4. Latency är inte helt och hållet ett problem med GPU:er, eftersom deras parallella natur gör det möjligt för dem att gå igenom flera beräkningar samtidigt. Även om GDDR5 har samma prefetchbuffertstorlek som DDR4 på 8n, överträffar den senaste GDDR5X-standarden detta med ett djup på 16n (16 datavord per minnesåtkomst). Dessutom kan GDDR hantera in- och utdata på samma klockcykel, till skillnad från DDR. Dessutom arbetar GDDR5 vid en lägre spänning än DDR4 på cirka ~1V, vilket innebär mindre värmespill och moduler med högre prestanda. I små paket som packas ihop tätt, som på ett grafikkorts PCB, är lägre värme avgörande. Systemminnet har hela pinnens yta att sprida sig på och är isolerat från komponenter med hög värme (som GPU:n).
Evolution
DDR SDRAM upplever inte den exponentiella tillväxt som dess grafikbaserade motsvarigheter upplever. Arbetet med DDR4 påbörjades runt 2005, men det kom inte ut på marknaden förrän 2014. DDR3 lanserades 2007 och används fortfarande i stor utsträckning i dag.
Den långa mognadstiden kan tillskrivas ett par faktorer. För det första tenderar RAM-leverantörerna att konkurrera mer på pris än på prestanda. RAM-minne är en handelsvara. Dessutom är RAM-branschen inte underkuvad av endast två konkurrenter som ständigt försöker att överträffa varandra. För det andra utvecklas och ratificeras nya minnesstandarder av JEDEC:s standardiseringsorgan, som består av alla minnestillverkare i världen som diskuterar nya standarder. Slutligen skriker minnesindustrin, när det gäller persondatorer, inte direkt efter högre bandbredd – numera är RAM-minnet sällan en flaskhals i presterande stationära persondatorer.
Det finns många fler katalysatorer för generationstillväxt när det gäller CPU:er och GPU:er, där utvecklingen till stor del drivs på av en eller två stora tillverkare som konkurrerar om marknadsandelar. Dessutom har GPGPU-pipeline (General Purpose Computing on Graphics Processing Units) kommit till, vilket innebär att GPU-accelererad databehandling har blivit vanlig. Detta innebär att kraftfulla GPU:er inte längre är önskvärda enbart för spelare, utan att efterfrågan ökar inom flera olika datorområden. Kapplöpningen om avancerad hårdvara och teknik fortsätter därför att vara hetsig, eftersom det behövs mer datorkraft för artificiell intelligens, djupinlärning, avancerad bildbehandling, finansiell modellering, datacenter osv.
Slutsats
Samtidigt som både DDR4 och GDDR5 har samma kärntekniker är den ena inte i sig bättre än den andra, utan båda är effektivt utrustade för att tjäna olika syften. Det finns några få skillnader som spelar in – som vi har beskrivit här – men i triviala termer kan det beskrivas som latenstid kontra bandbredd. CPU:er är mer beroende av cache och mer effektiva, och deras kärnor körs med mycket högre klockfrekvens än GPU:er. CPU:er behöver därför inte komma åt systemminnet lika ofta, men när de gör det är det viktigt med låg latenstid. GPU:er är mindre cacheladdade, men har mindre mängder mycket snabbare minne, så det kan vanligtvis nås mycket snabbare. Därför överförs höga beräkningsfunktioner där genomströmning är avgörande till grafikkortet och dess VRAM.
Editorial: Eric Hamilton