DDR4 SDRAM

Een snellere en lager voltage opvolger van DDR3, DDR4 is geaccepteerd als de huidige mainstream standaard aangezien veel processoren/platforms zoals Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99, en de aankomende Skylake-X en Ryzen DDR4 hebben geadopteerd. Net als een CPU is DDR4 gebouwd om een bombardement van kleine taken aan te kunnen met een lage latency en een zekere granulariteit. DDR4 is fundamenteel geschikt om kleine hoeveelheden gegevens snel over te dragen (relatief gesproken), ten koste van de totale bandbreedte. De busbreedte van DDR4 is 64 bits per kanaal, maar is combinatorisch, d.w.z. 128 bits busbreedte in dual channel. Bovendien heeft DDR4 een prefetch-buffergrootte van 8n (acht datawoorden per geheugentoegang), wat betekent dat 8 opeenvolgende datawoorden (woorden kunnen tussen 8-64 bits zijn) kunnen worden gelezen en vooraf in de I/O-buffer kunnen worden geplaatst. Ook is de I/O-interface beperkt tot lezen (uitvoer uit geheugen) of schrijven (invoer in geheugen) per klokcyclus, maar niet tot beide. Hieronder bespreken we hoe deze specificaties contrasteren met GDDR5.

GDDR5 SGRAM

GDDR5 is momenteel het meest gebruikte grafisch geheugen onder de laatste paar generaties GPU’s, maar de nieuwste versie is GDDR5X, en is momenteel slechts op twee kaarten geïmplementeerd: de GTX GeForce 1080 en Titan X (binnenkort, 1080 Ti). Vermeldenswaard is HBM (High-Bandwidth Memory) dat wordt gebruikt in sommige van de high-end Fiji GPU’s van AMD. HBM 2 is in januari 2016 geratificeerd door de JEDEC en wordt gebruikt in de nVidia Tesla P100 en zal vermoedelijk worden gebruikt in de high-end Vega-gebaseerde GPU’s van AMD.

GDDR5 is speciaal gebouwd voor bandbreedte; bijvoorbeeld het verplaatsen van enorme brokken gegevens in en uit de framebuffer met de hoogst mogelijke verwerkingscapaciteit. Dit wordt mogelijk gemaakt door een veel bredere bus – variërend van 256 tot 512 bits over 4-8 kanalen. Dit gaat echter wel ten koste van de latentie door veel lossere interne timings in vergelijking met DDR4. Latency is niet helemaal een probleem bij GPU’s, omdat ze door hun parallelle aard meerdere berekeningen tegelijk kunnen uitvoeren. Hoewel GDDR5 dezelfde prefetch-buffergrootte heeft als DDR4 van 8n, overtreft de nieuwste GDDR5X-standaard dat met een diepte van 16n (16 datawoorden per geheugentoegang). Bovendien kan GDDR input en output op dezelfde klokcyclus verwerken, in tegenstelling tot DDR. Bovendien werkt GDDR5 op een lager voltage dan DDR4 van ongeveer ~1V, wat minder warmteverspilling en beter presterende modules betekent. In kleine pakketjes die dicht op elkaar zitten, zoals op een printplaat van een grafische kaart, is minder warmte van cruciaal belang. Systeemgeheugen heeft het volledige oppervlak van de stick om zich te verspreiden, en is geïsoleerd van componenten met veel warmte (zoals de GPU).

Evolutie

DDR SDRAM kent niet de exponentiële groei die zijn op grafische kaarten gebaseerde tegenhangers doormaken. Het werk aan DDR4 begon rond 2005, maar het kwam pas in 2014 op de markt. DDR3 werd in 2007 gelanceerd en wordt vandaag de dag nog steeds veel gebruikt.

De lange draagtijd kan worden toegeschreven aan een paar factoren. Ten eerste concurreren RAM-verkopers meer op prijs dan op prestatie. RAM is een commoditized product. Bovendien wordt de RAM-industrie niet beheerst door slechts twee concurrenten die elkaar voortdurend de loef proberen af te steken. Ten tweede worden nieuwe geheugennormen ontwikkeld en bekrachtigd door het normalisatie-orgaan JEDEC, dat bestaat uit alle geheugenproducenten ter wereld die over nieuwe normen beraadslagen. Ten slotte is de geheugenindustrie, met betrekking tot PC’s, niet bepaald schreeuwend om hogere bandbreedte – tegenwoordig is RAM zelden een knelpunt in krachtige desktop PC’s.

Er zijn veel meer katalysatoren voor generatiegroei met betrekking tot CPU’s en GPU’s, waar de ontwikkeling grotendeels wordt gestimuleerd door een of twee grote fabrikanten die concurreren om marktaandeel. Met de komst van de GPGPU-pijplijn (General Purpose Computing on Graphics Processing Units) wordt GPU-versneld computergebruik steeds populairder. Dit betekent dat krachtige GPU’s niet langer uitsluitend zijn weggelegd voor gamers, maar dat de vraag groeit in verschillende computergebieden. De vraag naar geavanceerde hardware en technologie neemt toe, omdat er meer rekenkracht nodig is voor AI, deep learning, geavanceerde beeldverwerking, financiële modellering, datacenters, enz.

Conclusie

Hoewel zowel DDR4 als GDDR5 kerntechnologieën delen, is de ene niet inherent beter dan de andere; ze zijn beide effectief uitgerust om verschillende doelen te dienen. Er zijn een paar verschillen die een rol spelen – zoals we hier hebben beschreven – maar in triviale termen kan het worden beschreven als latency versus bandbreedte. CPU’s zijn afhankelijker van cache en efficiënter, en hun cores draaien op een veel hogere kloksnelheid dan die van GPU’s. CPU’s hoeven dus niet zo vaak het systeemgeheugen te benaderen, maar als ze dat doen, is een lage latentie van groot belang. GPU’s zijn minder cachebeladen, maar hebben kleinere hoeveelheden veel sneller geheugen, zodat het doorgaans veel sneller kan worden benaderd. Als zodanig worden hoge rekenfuncties waarbij doorvoer essentieel is, gedelegeerd naar de videokaart en zijn VRAM.

Editorial: Eric Hamilton

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.