DDR4 SDRAM
Um sucessor de maior velocidade e menor voltagem para DDR3, DDR4 tem sido aceito como o padrão atual de mainstream como muitos processadores/plataformas como Skylake, Kaby Lake, Haswell-E, Z170, Z270, X99, e os próximos Skylake-X e Ryzen adotaram DDR4. Muito parecido com uma CPU, o DDR4 é construído para lidar com um bombardeamento de pequenas tarefas com baixa latência e uma certa granularidade. O DDR4 é fundamentalmente adequado para transferir pequenas quantidades de dados rapidamente (comparativamente falando), em detrimento da largura de banda agregada. A largura do barramento DDR4 é de 64 bits por canal, mas é combinada; ou seja, largura de barramento de 128 bits em canal duplo. Além disso, o DDR4 tem um tamanho de buffer prefetch de 8n (oito palavras de dados por acesso à memória), o que significa que 8 palavras de dados consecutivos (palavras podem estar entre 8-64 bits) podem ser lidas e, atualmente, colocadas no buffer de E/S. Além disso, a interface I/O é limitada a uma leitura (saída da memória) ou escrita (entrada na memória) por ciclo de relógio, mas não as duas coisas. Abaixo, discutiremos como essas especificações contrastam com GDDR5.
GDDR5 SGRAM
GDDR5 é atualmente a memória gráfica mais comum entre as últimas gerações de GPUs, mas a versão mais recente é a GDDR5X, com apenas duas placas: a GTX GeForce 1080 e a Titan X (em breve, 1080 Ti). Vale a pena mencionar a HBM (High-Bandwidth Memory) usada em algumas das GPUs Fiji high-end da AMD. A HBM 2 foi ratificada pelo JEDEC em janeiro de 2016 e é usada no nVidia Tesla P100 e presumivelmente será usada nas GPUs high-end baseadas em Vega- pela AMD.
GDDR5 é construída propositadamente para largura de banda; por exemplo, movendo enormes pedaços de dados dentro e fora do framebuffer com a maior taxa de transferência possível. Isto é possível através de um bus muito mais largo – qualquer um com 256 a 512-bits em 4-8 canais. Apesar disso, ele vem com o custo do aumento da latência através de tempos internos muito mais frouxos quando comparado ao DDR4. A latência não é totalmente um problema com as GPUs, pois sua natureza paralela permite que elas se movam através de vários cálculos simultaneamente. Embora o GDDR5 tenha o mesmo tamanho de buffer pré-fetch que o DDR4 de 8n, o mais novo padrão GDDR5X supera aquele com uma profundidade de 16n (16 palavras de dados por acesso à memória). Além disso, o GDDR pode lidar com entrada e saída no mesmo ciclo do relógio, ao contrário do DDR. Além disso, o GDDR5 opera com uma tensão inferior à do DDR4 em cerca de ~1V, o que significa menos desperdício de calor e módulos de maior desempenho. Em pequenas embalagens que são embaladas densamente, como em uma placa de circuito impresso gráfica, um menor calor é crítico. A memória do sistema tem toda a área de superfície do bastão a ser espalhada, e é isolada de componentes de alto calor (como a GPU).
Evolução
DDR SDRAM não vê o crescimento exponencial que suas contrapartes baseadas em gráficos experimentam. O trabalho no DDR4 começou por volta de 2005, mas ele não chegou ao mercado até 2014. O DDR3 foi lançado em 2007 e ainda hoje é amplamente utilizado.
O longo período de gestação pode ser atribuído a alguns fatores. Primeiro, os fornecedores de RAM tendem a competir mais com base no preço, do que no desempenho. A RAM é mercantilizada. Além disso, a indústria de RAM não é subjugada por apenas dois concorrentes constantemente tentando saltar um para o outro. Em segundo lugar, novos padrões de memória são desenvolvidos e ratificados pelo organismo de normalização do JEDEC, que é composto por todos os fabricantes de memória do mundo que deliberam sobre novos padrões. Finalmente, a indústria de memória, no que diz respeito aos PCs, não está exatamente clamando por maior largura de banda – nestes dias, a RAM raramente é um gargalo no desempenho dos PCs desktop.
Existem muitos mais catalisadores para o crescimento geracional em relação às CPUs e GPUs, onde o desenvolvimento é largamente estimulado por um ou dois grandes fabricantes competindo por participação de mercado. Além disso, o advento do pipeline da GPGPU (General Purpose Computing on Graphics Processing Units) está vendo a computação acelerada por GPU se tornar o principal. Isso significa que as GPUs poderosas não são mais desejáveis exclusivamente para jogadores, com a demanda crescendo em vários domínios computacionais diferentes. Assim, a corrida por hardware e tecnologia avançados permanece desenfreada, pois é necessária mais potência de computação para IA, aprendizado profundo, processamento avançado de imagens, modelagem financeira, centros de dados etc.
Conclusão
Embora tanto DDR4 quanto GDDR5 compartilhem tecnologias centrais, uma não é inerentemente melhor do que a outra; ambas são efetivamente equipadas para atender a propósitos diferentes. Há poucos diferenciadores que entram em jogo – como já descrevemos aqui – mas em termos triviais, poderia ser descrito como latência vs. largura de banda. As CPUs são mais dependentes do cache e eficientes, e os seus núcleos funcionam a uma taxa de relógio muito mais elevada do que a das GPUs. Como tal, as CPUs não têm de aceder à memória do sistema com a mesma frequência, mas quando o fazem, é imperativa uma baixa latência. As GPUs são menos carregadas de cache, mas têm quantidades menores de memória muito mais rápida, de modo que normalmente pode ser acessada muito mais rapidamente. Como tal, funções de computação altas onde a taxa de transferência é a chave são descarregadas para a placa de vídeo e sua VRAM.
Editorial: Eric Hamilton