DDR4 SDRAM
Un successore più veloce e con un voltaggio più basso della DDR3, DDR4 è stata accettata come l’attuale standard mainstream poiché molti processori/piattaforme come Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99, e i prossimi Skylake-X e Ryzen hanno adottato DDR4. Proprio come una CPU, DDR4 è costruita per gestire un bombardamento di piccoli compiti con bassa latenza e una certa granularità. DDR4 è fondamentalmente adatta a trasferire piccole quantità di dati rapidamente (relativamente parlando), a scapito della larghezza di banda aggregata. La larghezza del bus DDR4 è di 64 bit per canale, ma è combinatoria; cioè, larghezza del bus a 128 bit in doppio canale. Inoltre, DDR4 ha un buffer prefetch di 8n (otto parole di dati per accesso alla memoria), il che significa che 8 parole di dati consecutive (le parole possono essere tra 8-64 bit) possono essere lette e messe in anticipo nel buffer I/O. Inoltre, l’interfaccia I/O è limitata a una lettura (uscita dalla memoria) o scrittura (ingresso alla memoria) per ciclo di clock, ma non entrambe. Di seguito, discuteremo come queste specifiche contrastano con la GDDR5.
GDDR5 SGRAM
GDDR5 è attualmente la memoria grafica più comune tra le ultime due generazioni di GPU, ma la versione più recente è la GDDR5X, che è attualmente implementata solo su due schede: la GTX GeForce 1080 e Titan X (presto, 1080 Ti). Degno di nota è HBM (High-Bandwidth Memory) utilizzato in alcune delle GPU di fascia alta Fiji di AMD. HBM 2 è stata ratificata dalla JEDEC nel gennaio del 2016 ed è utilizzata nella nVidia Tesla P100 e sarà presumibilmente utilizzata nelle GPU di fascia alta basate su Vega di AMD.
GDDR5 è costruita appositamente per la larghezza di banda; ad esempio, lo spostamento di enormi quantità di dati dentro e fuori il framebuffer con il massimo throughput possibile. Questo è reso possibile da un bus molto più ampio, da 256 a 512 bit attraverso 4-8 canali. Anche se questo avviene a costo di un aumento della latenza attraverso un timing interno molto meno rigido rispetto alle DDR4. La latenza non è del tutto un problema con le GPU, in quanto la loro natura parallela permette loro di muoversi su più calcoli contemporaneamente. Anche se GDDR5 ha la stessa dimensione del buffer di prefetch di DDR4 di 8n, il più recente standard GDDR5X lo supera con una profondità di 16n (16 parole di dati per accesso alla memoria). Inoltre, GDDR può gestire input e output sullo stesso ciclo di clock, a differenza di DDR. Inoltre, GDDR5 opera a una tensione più bassa di DDR4 a circa ~1V, il che significa meno spreco di calore e moduli più performanti. In piccoli pacchetti che sono impacchettati insieme densamente, come sul PCB di una scheda grafica, il minor calore è fondamentale. La memoria di sistema ha l’intera superficie dello stick per diffondersi, ed è isolata dai componenti ad alto calore (come la GPU).
Evoluzione
La DDR SDRAM non vede la crescita esponenziale che sperimentano le sue controparti basate sulla grafica. I lavori sulle DDR4 sono iniziati intorno al 2005, ma non sono arrivati sul mercato fino al 2014. La DDR3 è stata lanciata nel 2007 ed è ancora ampiamente utilizzata oggi.
Il lungo periodo di gestazione può essere attribuito ad alcuni fattori. In primo luogo, i fornitori di RAM tendono a competere più su una base di prezzo, piuttosto che su una base di prestazioni. La RAM è mercificata. Inoltre, l’industria della RAM non è soggiogata da due soli concorrenti che cercano costantemente di superarsi l’un l’altro. In secondo luogo, i nuovi standard di memoria sono sviluppati e ratificati dall’organismo di standard JEDEC, che è composto da ogni produttore di memoria nel mondo che delibera sui nuovi standard. Infine, l’industria della memoria, per quanto riguarda i PC, non sta esattamente chiedendo a gran voce una maggiore larghezza di banda – di questi tempi, la RAM è raramente un collo di bottiglia nei PC desktop ad alte prestazioni.
Ci sono molti più catalizzatori per la crescita generazionale per quanto riguarda le CPU e le GPU, dove lo sviluppo è in gran parte stimolato da uno o due grandi produttori in competizione per la quota di mercato. Inoltre, l’avvento della pipeline GPGPU (General Purpose Computing on Graphics Processing Units) sta vedendo il calcolo accelerato dalla GPU diventare mainstream. Questo significa che le potenti GPU non sono più desiderabili esclusivamente per i giocatori, con una domanda in crescita in diversi domini informatici. Quindi, la corsa all’hardware e alla tecnologia avanzata rimane dilagante, poiché è necessaria una maggiore potenza di calcolo per l’intelligenza artificiale, l’apprendimento profondo, l’elaborazione avanzata delle immagini, la modellazione finanziaria, i data center, ecc.
Conclusione
Mentre sia le DDR4 che le GDDR5 condividono tecnologie di base, una non è intrinsecamente migliore dell’altra; sono entrambe efficacemente attrezzate per servire scopi diversi. Ci sono alcuni fattori di differenziazione che entrano in gioco – come abbiamo descritto qui – ma in termini banali, potrebbe essere descritto come latenza vs. larghezza di banda. Le CPU sono più dipendenti dalla cache ed efficienti, e i loro core funzionano a una frequenza di clock molto più alta di quella delle GPU. Come tali, le CPU non devono accedere alla memoria di sistema così frequentemente, ma quando lo fanno, una bassa latenza è imperativa. Le GPU sono meno cariche di cache, ma hanno quantità più piccole di memoria molto più veloce, quindi in genere si può accedere molto più velocemente. Come tale, le funzioni di calcolo elevate in cui il throughput è fondamentale vengono scaricate sulla scheda video e la sua VRAM.
Editoriale: Eric Hamilton