Kepler (microarquitetura)
A arquitetura Kepler de 28 nm (Nanômetros), sucessora da arquitetura Fermi, é a última arquitetura projetada pela NVIDIA. Seu foco, ao ser projetada, foi conseguir o maior número de desempenho por watt. As primeiras placas a utilizar essa tecnologia são a GeForce GTX 680, para desktops, e a GeForce GT 640M, para notebooks.[1]
Arquitetura Kepler[editar | editar código-fonte]
O Kepler é uma Fermi remodelada, porém com algumas diferenças fundamentais, cada SMX contém agora 192 CUDA cores, para um total de 1536 cores em todo o GPU Kepler, e os motores polimorfos foram redesenhados. Essas mudanças fizeram com que o desempenho aumentasse consideravelmente se comparadas às da Fermi. Com isso a GPU Kepler usa menos energia ao mesmo tempo em que proporciona mais desempenho.
Além disso, foram feitas alterações no sistema de memória e na estrutura de processamento. Um cache L2 de 512KB é compartilhado por toda GPU, proporcionando espaço de buffer para várias unidades do chip, a sua frequência da largura de banda de cache e a operação atômica foram aumentados para fornecer um maior suporte aos CUDA cores. A GPU Kepler conta com quatro controladores de memória de 64 bits, operando a uma taxa de 6.008 MHz, o que é quase o dobro de sua antecessora, que contava com seis controladores de 64 bits.
Foi implementada na Kepler um novo motor de display, capaz de mostrar até 4 monitores ao mesmo tempo com apenas uma GPU, inclusive com a opção de 3D em todos os monitores. A codificação de vídeo deixou de ser feita pelos CUDA cores, e passou a ser feito por um software implementado direto no hardware, chamado NVENC. Tal mudança fez com que a GPU consumisse menos energia e deixasse a codificação quatro vezes mais rápida.
Todas as mudanças resultaram no que é a GPU mais rápida e com menos consumo de energia já vista. Porém isso tudo não veio sem um sacrifício. As GPUs Fermi têm uma habilidade de fazer cálculos muito superiores se comparadas a Kepler, pois a NVIDIA tirou algumas dessas habilidades para melhorar a eficiência por energia.
Temporal Anti-Aliasing[editar | editar código-fonte]
TXAA é uma técnica que junta o MSAA com o FXAA, onde são analisados todos os pixels na tela e "amacia" o contraste entre os pixels, retirando o serrilhado. Com isso o TXAA entrega uma imagem com 8x mais qualidade que o MSAA com velocidade de apenas 2x MSAA.
Objetivos[editar | editar código-fonte]
A arquitetura Kepler tem como objetivo não só criar a GPU mais rápida do mundo, mas também a GPU com maior desempenho e eficiência energética (Performance x Watt).
Sua Fabricação em 28 nm é um dos importantes fatores pelo baixo consumo da nova arquitetura sem deixar de lado a alta performance.
SMX[editar | editar código-fonte]
Outra modificação que contribui com a eficiência é o novo design do SM (Streaming Multiprocessor) que recebeu o nome de "SMX" e foi especialmente redesenhado para obter a maior eficiência em performance por watt. Para melhorar a eficiência, o SMX roda com clock gráfico ao invés de utilizar o shader core clock, mas com 1536 CUDA cores em GK104, a GeForce GTX 680 SMX oferece 2x mais performance por watt que sua antecessora, a "Fermi" SM (GF110). Isso permite que a nova GTX 680 proporcione uma revolucionaria performance por watt em comparação a GTX 580.
GPU Boost[editar | editar código-fonte]
Uma outra tecnologia que foi implantada para favorecer a performance por watt é a chamada GPU Boost que funciona de maneira semelhante a tecnologia Turbo Boost dos processadores Intel. O GPU Boost reduz a velocidade do clock quando não for necessário todo o processamento da GPU, e aumentando a velocidade do clock sempre que necessário acompanhando a demanda de processamento do GPU.
Desempenho x Energia[editar | editar código-fonte]
A economia de energia é algo que realmente impressiona na Kepler. Comparada à antecessora, a energia ativa foi reduzida em 15%, e o desperdício em 50%, o que resultou em uma melhora global de 35%. O que não é à toa, pois a maioria das mudanças tinha esse propósito. O consumo de energia de processadores stream e controles lógicos foram reduzidos, agora ao contrário da Fermi, as GPU Kepler tem clock na mesma frequência. Os geradores de clock e os processadores de Stream requerem menos energia à frequência mais baixa, com isso o consumo total de energia é reduzido, embora o desempenho máximo teórico permaneça o mesmo. Com essas mudanças voltadas para uma melhora na eficiência energética, os usuários de notebooks são os que mais sairão ganhando, uma vez que a economia de energia é essencial.
GPU | Fermi (GF110) | Kepler (GK104) |
---|---|---|
Transistor | 3.0 bilhões | 3.54 bilhões |
CUDA cores | 512 | 1536 |
Graphics Core Clock | 772 MHz | 1006 MHz |
Shader Core Clock | 1544 MHz | n/a |
GFLOPs | 1581 | 3090 |
Unidades de Textura | 64 | 128 |
Taxa de Preenchimento Texel | 49.Gigatexels/sec | 128.8 Gigatexels/sec |
Clock da Memória | 4008 MHz | 6008 MHz |
Largura de Banda da Memória | 192.4GB/s | 192.26GB/s |
Máximo de Monitores | 2 | 4 |
TDP | 244W | 195W |
Motores GPC/Raster na GPU | 4 | 4 |
Motores SM/SMX/Polimorfo na GPU | 16 | 8 |
TMU no SM/SMX | 4 | 16 |
TMU na GPU | 64 | 128 |
CUDA Cores no SM/SMX | 32 | 192 |
SFU no SM/SMX | 4 | 32 |
LSU no SM/SMX | 16 | 32 |
Warp Sheduler/ Dispatch Unit no SM/SMX | 2/2 | 4/8 |
Tamanho de arquivo no SM/SMX | 32768 x 32-bit | 65536 x 32-bit |
Referências
- ↑ «Nvidia Strikes Back: GeForce GTX 680 2 GB on "Kepler" Graphics Architecture . Page 2 - X-bit labs». www.xbitlabs.com. Consultado em 17 de maio de 2012. Arquivado do original em 29 de abril de 2012