Kepler (microarquitetura)

Origem: Wikipédia, a enciclopédia livre.

A arquitetura Kepler de 28 nm (Nanômetros), sucessora da arquitetura Fermi, é a última arquitetura projetada pela NVIDIA. Seu foco, ao ser projetada, foi conseguir o maior número de desempenho por watt. As primeiras placas a utilizar essa tecnologia são a GeForce GTX 680, para desktops, e a GeForce GT 640M, para notebooks.[1]

Arquitetura Kepler[editar | editar código-fonte]

O Kepler é uma Fermi remodelada, porém com algumas diferenças fundamentais, cada SMX contém agora 192 CUDA cores, para um total de 1536 cores em todo o GPU Kepler, e os motores polimorfos foram redesenhados. Essas mudanças fizeram com que o desempenho aumentasse consideravelmente se comparadas às da Fermi. Com isso a GPU Kepler usa menos energia ao mesmo tempo em que proporciona mais desempenho.

Além disso, foram feitas alterações no sistema de memória e na estrutura de processamento. Um cache L2 de 512KB é compartilhado por toda GPU, proporcionando espaço de buffer para várias unidades do chip, a sua frequência da largura de banda de cache e a operação atômica foram aumentados para fornecer um maior suporte aos CUDA cores. A GPU Kepler conta com quatro controladores de memória de 64 bits, operando a uma taxa de 6.008 MHz, o que é quase o dobro de sua antecessora, que contava com seis controladores de 64 bits.

Foi implementada na Kepler um novo motor de display, capaz de mostrar até 4 monitores ao mesmo tempo com apenas uma GPU, inclusive com a opção de 3D em todos os monitores. A codificação de vídeo deixou de ser feita pelos CUDA cores, e passou a ser feito por um software implementado direto no hardware, chamado NVENC. Tal mudança fez com que a GPU consumisse menos energia e deixasse a codificação quatro vezes mais rápida.

Todas as mudanças resultaram no que é a GPU mais rápida e com menos consumo de energia já vista. Porém isso tudo não veio sem um sacrifício. As GPUs Fermi têm uma habilidade de fazer cálculos muito superiores se comparadas a Kepler, pois a NVIDIA tirou algumas dessas habilidades para melhorar a eficiência por energia.

Temporal Anti-Aliasing[editar | editar código-fonte]

TXAA é uma técnica que junta o MSAA com o FXAA, onde são analisados todos os pixels na tela e "amacia" o contraste entre os pixels, retirando o serrilhado. Com isso o TXAA entrega uma imagem com 8x mais qualidade que o MSAA com velocidade de apenas 2x MSAA.

Objetivos[editar | editar código-fonte]

A arquitetura Kepler tem como objetivo não só criar a GPU mais rápida do mundo, mas também a GPU com maior desempenho e eficiência energética (Performance x Watt).

Sua Fabricação em 28 nm é um dos importantes fatores pelo baixo consumo da nova arquitetura sem deixar de lado a alta performance.

SMX[editar | editar código-fonte]

Outra modificação que contribui com a eficiência é o novo design do SM (Streaming Multiprocessor) que recebeu o nome de "SMX" e foi especialmente redesenhado para obter a maior eficiência em performance por watt. Para melhorar a eficiência, o SMX roda com clock gráfico ao invés de utilizar o shader core clock, mas com 1536 CUDA cores em GK104, a GeForce GTX 680 SMX oferece 2x mais performance por watt que sua antecessora, a "Fermi" SM (GF110). Isso permite que a nova GTX 680 proporcione uma revolucionaria performance por watt em comparação a GTX 580.

GPU Boost[editar | editar código-fonte]

Uma outra tecnologia que foi implantada para favorecer a performance por watt é a chamada GPU Boost que funciona de maneira semelhante a tecnologia Turbo Boost dos processadores Intel. O GPU Boost reduz a velocidade do clock quando não for necessário todo o processamento da GPU, e aumentando a velocidade do clock sempre que necessário acompanhando a demanda de processamento do GPU.

Desempenho x Energia[editar | editar código-fonte]

Consumo de Energia
Melhora na Eficiência Energética (Per x Watt)

A economia de energia é algo que realmente impressiona na Kepler. Comparada à antecessora, a energia ativa foi reduzida em 15%, e o desperdício em 50%, o que resultou em uma melhora global de 35%. O que não é à toa, pois a maioria das mudanças tinha esse propósito. O consumo de energia de processadores stream e controles lógicos foram reduzidos, agora ao contrário da Fermi, as GPU Kepler tem clock na mesma frequência. Os geradores de clock e os processadores de Stream requerem menos energia à frequência mais baixa, com isso o consumo total de energia é reduzido, embora o desempenho máximo teórico permaneça o mesmo. Com essas mudanças voltadas para uma melhora na eficiência energética, os usuários de notebooks são os que mais sairão ganhando, uma vez que a economia de energia é essencial.

GPU Fermi (GF110) Kepler (GK104)
Transistor 3.0 bilhões 3.54 bilhões
CUDA cores 512 1536
Graphics Core Clock 772 MHz 1006 MHz
Shader Core Clock 1544 MHz n/a
GFLOPs 1581 3090
Unidades de Textura 64 128
Taxa de Preenchimento Texel 49.Gigatexels/sec 128.8 Gigatexels/sec
Clock da Memória 4008 MHz 6008 MHz
Largura de Banda da Memória 192.4GB/s 192.26GB/s
Máximo de Monitores 2 4
TDP 244W 195W
Motores GPC/Raster na GPU 4 4
Motores SM/SMX/Polimorfo na GPU 16 8
TMU no SM/SMX 4 16
TMU na GPU 64 128
CUDA Cores no SM/SMX 32 192
SFU no SM/SMX 4 32
LSU no SM/SMX 16 32
Warp Sheduler/ Dispatch Unit no SM/SMX 2/2 4/8
Tamanho de arquivo no SM/SMX 32768 x 32-bit 65536 x 32-bit

Referências

  1. «Nvidia Strikes Back: GeForce GTX 680 2 GB on "Kepler" Graphics Architecture . Page 2 - X-bit labs». www.xbitlabs.com. Consultado em 17 de maio de 2012. Arquivado do original em 29 de abril de 2012