DDR4 SDRAM
Sukcesor DDR3 o wyższej prędkości i niższym napięciu, DDR4 został przyjęty jako obecny standard mainstream, ponieważ wiele procesorów/platform takich jak Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99, oraz nadchodzące Skylake-X i Ryzen przyjęły DDR4. Podobnie jak procesor, DDR4 jest zbudowany do obsługi bombardowania małych zadań z niskimi opóźnieniami i pewną ziarnistością. DDR4 jest zasadniczo przystosowana do szybkiego przesyłania niewielkich ilości danych (w porównaniu z innymi), kosztem łącznej przepustowości. Szerokość magistrali DDR4 wynosi 64 bity na kanał, ale jest kombinowana; tzn. 128-bitowa szerokość magistrali w dual channel. Dodatkowo, DDR4 ma rozmiar bufora prefetch 8n (osiem słów danych na dostęp do pamięci), co oznacza, że 8 kolejnych słów danych (słowa mogą mieć rozmiar od 8-64 bitów) może być odczytanych i umieszczonych w buforze I/O. Ponadto, interfejs I/O jest ograniczony do odczytu (wyjście z pamięci) lub zapisu (wejście do pamięci) na cykl zegara, ale nie do obu. Poniżej omówimy, jak te specyfikacje kontrastują z GDDR5.
GDDR5 SGRAM
GDDR5 jest obecnie najczęściej stosowaną pamięcią graficzną wśród kilku ostatnich generacji GPU, ale najnowszą wersją jest GDDR5X, przy czym jest ona obecnie zaimplementowana tylko w dwóch kartach: GTX GeForce 1080 i Titan X (wkrótce 1080 Ti). Warto wspomnieć o HBM (High-Bandwidth Memory) stosowanym w niektórych high-endowych GPU Fiji firmy AMD. HBM 2 została ratyfikowana przez JEDEC w styczniu 2016 roku i jest wykorzystywana w nVidia Tesla P100 i prawdopodobnie będzie wykorzystywana w high-endowych procesorach graficznych AMD opartych na architekturze Vega.
GDDR5 została stworzona z myślą o przepustowości; np. przenoszenie ogromnych porcji danych do i z bufora ramki z najwyższą możliwą przepustowością. Jest to możliwe dzięki znacznie szerszej magistrali – od 256 do 512 bitów w 4-8 kanałach. Aczkolwiek odbywa się to kosztem zwiększonych opóźnień poprzez znacznie luźniejsze timingi wewnętrzne w porównaniu do DDR4. Opóźnienia nie są całkowicie problemem w przypadku procesorów graficznych, ponieważ ich równoległa natura pozwala im na wykonywanie wielu obliczeń jednocześnie. Choć GDDR5 ma taki sam rozmiar bufora pobierającego dane (prefetch buffer) jak DDR4, wynoszący 8n, najnowszy standard GDDR5X przewyższa go, oferując głębokość 16n (16 słów danych na każdy dostęp do pamięci). Co więcej, GDDR może obsługiwać wejście i wyjście w tym samym cyklu zegara, w przeciwieństwie do DDR. Ponadto GDDR5 pracuje przy niższym napięciu niż DDR4, wynoszącym około ~1V, co oznacza mniejsze straty ciepła i wyższą wydajność modułów. W małych pakietach, które są gęsto upakowane razem, jak na płytce PCB karty graficznej, niższe ciepło jest krytyczne. Pamięć systemowa ma całą powierzchnię kija do rozprzestrzeniania się i jest odizolowana od wysoko grzejących się komponentów (takich jak GPU).
Ewolucja
DDR SDRAM nie odnotowuje wykładniczego wzrostu, jakiego doświadczają jej graficzne odpowiedniki. Prace nad DDR4 rozpoczęły się około 2005 roku, ale na rynek trafiły dopiero w 2014 roku. DDR3 została wprowadzona na rynek w 2007 roku i do dziś jest powszechnie używana.
Długi okres dojrzewania może być przypisany kilku czynnikom. Po pierwsze, producenci pamięci RAM mają tendencję do konkurowania na podstawie ceny, a nie na podstawie wydajności. Pamięć RAM jest towarem pierwszej potrzeby. Co więcej, branża RAM nie jest podporządkowana tylko dwóm konkurentom, którzy ciągle próbują się nawzajem prześcigać. Po drugie, nowe standardy pamięci są opracowywane i ratyfikowane przez organ normalizacyjny JEDEC, który składa się z każdego producenta pamięci na świecie, obradującego nad nowymi standardami. Wreszcie, przemysł pamięci, w odniesieniu do komputerów PC, nie jest tak bardzo żądny wyższej przepustowości – obecnie pamięć RAM rzadko jest wąskim gardłem w wydajnych komputerach stacjonarnych.
Istnieje o wiele więcej katalizatorów wzrostu generacyjnego w odniesieniu do CPU i GPU, gdzie rozwój jest w dużej mierze napędzany przez jednego lub dwóch dużych producentów rywalizujących o udział w rynku. Dodatkowo, nadejście potoku GPGPU (General Purpose Computing on Graphics Processing Units) sprawiło, że obliczenia akcelerowane przez GPU stały się głównym nurtem. Oznacza to, że wydajne procesory graficzne nie są już pożądane wyłącznie przez graczy, a zapotrzebowanie na nie rośnie w wielu różnych dziedzinach obliczeniowych. Tak więc wyścig o zaawansowany sprzęt i technologię nadal trwa, ponieważ potrzeba więcej mocy obliczeniowej dla AI, głębokiego uczenia się, zaawansowanego przetwarzania obrazu, modelowania finansowego, centrów danych itp.
Wnioski
Podczas gdy zarówno DDR4 jak i GDDR5 wykorzystują wspólne technologie, jedna z nich nie jest z natury lepsza od drugiej; obie są efektywnie wyposażone, aby służyć różnym celom. Istnieje kilka czynników różnicujących, które wchodzą w grę – jak opisaliśmy tutaj – ale w trywialnych kategoriach, można to opisać jako opóźnienie vs. przepustowość. Procesory centralne są bardziej zależne od pamięci podręcznej i wydajne, a ich rdzenie pracują z dużo wyższą częstotliwością taktowania niż procesory graficzne. Jako takie, procesory centralne nie muszą tak często sięgać do pamięci systemowej, ale gdy już to robią, niskie opóźnienia są niezbędne. Układy GPU są mniej obciążone pamięcią podręczną, ale posiadają mniejsze ilości znacznie szybszej pamięci, więc dostęp do niej jest zazwyczaj znacznie szybszy. W związku z tym, funkcje o wysokiej wydajności obliczeniowej, w których kluczowa jest przepustowość, są przenoszone na kartę graficzną i jej pamięć VRAM.
Editorial: Eric Hamilton
.