DDR4 SDRAM
DDR3の後継として、より高速で低電圧のDDR4はSkylake、Kaby Lake、Haswell-E、Z170、Z270、X99など多くのプロセッサ/プラットフォームや今後登場が期待されているSkylake-XやRyzenなどが採用しているので現在の主流規格として受け入れられている。 DDR4はCPUと同様に、小さなタスクの集中砲火を低レイテンシで一定の粒度で処理できるように作られています。 DDR4は基本的に、集約された帯域幅を犠牲にして、少量のデータを(比較的)速く転送するのに向いている。 DDR4のバス幅は1チャネルあたり64ビットだが、組み合わせ式で、つまりデュアルチャネルではバス幅128ビットとなる。 さらに、DDR4はプリフェッチバッファのサイズが8n(1回のメモリアクセスで8データワード)であり、連続する8データワード(ワードは8~64ビットの間で可)を読み出してI/Oバッファにプリフェッチすることが可能である。 また、I/Oインタフェースは1クロックあたりリード(メモリからの出力)またはライト(メモリへの入力)に制限され、両方はできません。 以下、これらの仕様と GDDR5 との対比について説明します。
GDDR5 SGRAM
GDDR5 は、過去数世代の GPU で現在最も一般的なグラフィックス メモリですが、最新バージョンは GDDR5X で、現在は GTX GeForce 1080 および Titan X (まもなく 1080 Ti) という 2 枚のみ実装されるようになっています。 特筆すべきは、AMDのハイエンドGPU「Fiji」の一部に採用されているHBM(High-Bandwidth Memory)だ。 HBM 2 は、2016 年 1 月に JEDEC によって承認され、nVidia Tesla P100 で使用されており、おそらく AMD のハイエンド Vega ベース GPU でも使用されるでしょう。
GDDR5 は、バンド幅に特化して構築されており、たとえば、フレームバッファに大量のデータを移動して最高のスループットにすることが可能です。 これは、4 ~ 8 チャンネルにわたる 256 ~ 512 ビットという、より広いバスによって可能になります。 ただし、DDR4と比較すると、内部タイミングがかなり緩くなるため、レイテンシが増加するという代償を払うことになる。 GPUは並列処理により複数の計算を同時に行うため、レイテンシは完全に問題ではありません。 GDDR5のプリフェッチバッファサイズはDDR4と同じ8nですが、最新のGDDR5X規格ではそれを上回る16n(メモリアクセスあたり16データワード)の深さになっています。 さらに、GDDRはDDRと異なり、同じクロックサイクルで入力と出力を処理することができます。 さらに、GDDR5 は DDR4 よりも低い電圧で動作し、約 ~1V で動作するため、熱の無駄が少なく、高性能なモジュールとなります。 グラフィックス・カードPCBのように、高密度に配置された小型パッケージでは、低発熱が非常に重要である。 システム メモリはスティックの全表面積に広がり、高熱のコンポーネント (GPU など) から隔離されます。
Evolution
DDR SDRAM は、グラフィックス ベース製品のような急激な成長を遂げているわけではありません。 DDR4は2005年ごろに開発が始まりましたが、市場に出たのは2014年です。 DDR3 は 2007 年に発売され、現在も広く使用されています。
この長い成長期間は、いくつかの要因に起因しています。 まず、RAM ベンダーは、パフォーマンス ベースではなく、より価格ベースで競争する傾向があります。 RAM はコモディティ化されています。 さらに、RAM業界は、常にお互いを飛び越えようとする2つの競合他社だけに支配されているわけではありません。 第二に、新しいメモリ規格は、世界中のあらゆるメモリメーカーが参加するJEDECという標準化団体で審議され、承認される。 最近では、RAM が高性能デスクトップ PC のボトルネックになることはほとんどありません。
CPUとGPUに関しては、世代交代を促進する多くの触媒があり、1、2 の大手メーカーが市場シェアを争って開発に拍車をかけています。 また、GPGPUパイプライン(General Purpose Computing on Graphics Processing Units)の登場により、GPUアクセラレーションによるコンピューティングが主流になりつつあります。 つまり、強力なGPUはもはやゲーマーだけに望まれるものではなく、さまざまなコンピューティング領域で需要が高まっているのです。 したがって、AI、ディープラーニング、高度な画像処理、金融モデリング、データセンターなどでより多くのコンピューティング馬力が必要とされるため、先進のハードウェアとテクノロジーに対する競争は依然として激化しています。
Conclusion
DDR4 と GDDR5 はともにコアテクノロジーを共有していますが、どちらかが他より本質的に優れているというわけではなく、異なる目的を果たすために効果的に装備されているのです。 ここで説明したように、いくつかの差別化要因がありますが、些細な用語では、レイテンシと帯域幅と表現することができます。 CPU はよりキャッシュに依存し、効率的であり、そのコアは GPU よりもはるかに高いクロックレートで動作しています。 そのため、CPU はそれほど頻繁にシステムメモリにアク セスする必要はありませんが、アクセスするときは低レイテンシが必須と なります。 GPU はキャッシュが少ないですが、より高速なメモリを少量搭載しているため、通常、より速くアクセスすることができます。 そのため、スループットが重要である高度な計算機能は、ビデオ カードとその VRAM にオフロードされます。 Eric Hamilton