O que é Nvidia Ampere?

Quando se trata de GPUs, a Nvidia é uma especialista líder. No negócio desde 1993, a Nvidia produziu uma ampla gama de GPUs profissionais e de consumo de alta qualidade. As conceituadas arquiteturas de seus processadores estão por trás do sucesso de seus produtos, especialmente de sua linha principal, a GeForce. As GPUs da Nvidia foram além do espaço de jogos, expandindo sua presença em aprendizagem profunda, IA (Inteligência Artificial) e análises aceleradas. A Nvidia se infiltrou no mercado de data centers há uma década, começando com os chips Fermi. As iterações subsequentes foram feitas, e a empresa lançou continuamente GPUs que atendem à demanda insaciável por velocidade de processamento mais rápida em data centers. As GPUs da Nvidia evoluíram ao longo dos anos, e os designs de arquitetura impulsionam principalmente a evolução.

Arquitetura Ampere da Nvidia

A competição é seriamente acirrada entre os fabricantes de GPU, mas a Nvidia não se detém para ocupar o primeiro lugar. Na verdade, a Nvidia dominou o mercado de IA na última década. Em 2020, as notícias da primeira GPU de 7nm (8nm para peças de consumo) da Nvidia com 54 bilhões de transistores compactados em um molde tão pequeno causaram um grande alvoroço. Codinome Ampère depois do matemático francês André-Marie Ampère, A arquitetura do processador da Nvidia impulsiona uma grande melhoria em relação a seus predecessores, Turing e Volta, prometendo mais funcionalidades, melhor eficiência e maior desempenho em níveis de energia mais baixos. A Ampere está por trás da segunda geração de GPUs RTX da Nvidia, a série RTX 30, e é considerada duas vezes mais rápida que suas contrapartes da série RTX 20. A arquitetura Ampere também é a força por trás das GPUs de data center Nvidia A100.

Especificações do Ampère

Ampere é a primeira GPU 7nm / 8nm da Nvidia, a segunda geração de rastreamento de raio do consumidor e tem a terceira geração de núcleos tensores. Ampere é a arquitetura subjacente das GPUs GA100, GA102 e GA104 que estão incorporadas no GeForce RTX 3090, RTX 3080, RTX 3070 e, mais recentemente, no RTX 3060. A Nvidia também está programada para lançar RTX 3050 nos próximos meses. Enquanto isso, a GPU corporativa GA100 oferece 20x mais potência de computação do que as gerações anteriores de GPUs de data center. Esta é uma visão geral das GPUs profissionais e de consumidor baseadas em Ampere da Nvidia [1]:

GPU	GA100	GA102	GA102	GA104
Placa de vídeo	Nvidia A100	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
Processo (nm)	TSMC N7	Samsung 8N	Samsung 8N	Samsung 8N
Transistores (bilhões)	54	28.3	28.3	17.4
Tamanho do molde (mm ^ 2)	826	628.4	628.4	392.5
Configuração GPC	8 × 16	7 × 12	6 × 12	6 × 8
SMS	108	82	68	46
Núcleos CUDA	6912	10496	8704	5888
Núcleos RT	Nenhum	82	68	46
Núcleos tensores	432	328	272	184
Boost Clock (MHz)	1410	1700	1710	1730
Velocidade VRAM (Gbps)	2.43	19.5 (GDDR6X)	19 (GDDR6X)	14 (GDDR6)
VRAM (GB)	40 (48 máx.)	24	10	8
Largura do ônibus	5120 (6144 máx.)	384	320	256
ROPs	128	112	96	96
TMUs	864	656	544	368
GFLOPS FP32	19492	35686	29768	20372
RT TFLOPS	N / D	69	58	40
Tensor TFLOPS FP16 (esparsidade)	312 (628)	143 (285)	119 (238)	81 (163)
Largura de banda (GB / s)	1555	936	760	448
TBP (watts)	400 (250 PCIe)	350	320	220

Nvidia A100

A Nvidia A100 é a primeira GPU que usou a arquitetura Ampere. O chip corporativo é voltado para data centers e projetado para tarefas com uso intensivo de GPU, como aprendizado profundo e IA. Construído usando o processo de 7 nm da TSMC, ele abriga uma quantidade enorme de 54 bilhões de transistores. Ele superou as gerações anteriores de GPUs empresariais com um aumento de 20x no desempenho com 6.912 núcleos CUDA, 432 unidades de mapeamento de textura, 160 ROPs, núcleos Tensor de terceira geração e um VRAM de 40 GB com largura de banda de memória que chega a 1.6 TB / s. DGX A100 é o primeiro sistema de IA do mundo com um cluster de oito A100s e um preço robusto de US $ 199.000.

GeForce RTX 30 Series

Além de dominar o mercado corporativo, a Nvidia sempre tem os consumidores, especialmente os jogadores e criadores, em mente. A arquitetura Ampere também é adotada nas placas gráficas de consumo da Nvidia. A segunda geração da GeForce RTX carrega as GPUs baseadas em Ampere, aumentando o desempenho para o dobro da geração anterior.

Na maioria dos aspectos, Ampère tem mais do que o dobro da capacidade de processamento de Turing. Ele dobrou o desempenho do shader de Turing com o dobro de núcleos FP32 CUDA. Especificamente, tem 30 Shader-TFLOPS, 2.7x mais do que o de Turing, que é apenas 11 Shader-TFLOPS. Da mesma forma, o Tensor Core de Turing mede em 89 Tensor-TFLOPS, mas Ampere mais que dobrou essa taxa com seu 238 Tensor-TFLOPS. Sem esquecer suas taxas de Ray Tracing Core, que é 58 RT-TFLOPS, 1.7x mais rápido do que os 34 RT-TFLOPS de Turing, e para fazer as GPUs rodarem ainda mais rápido, o chip Ampere se conecta à memória mais rápida do mundo, o Micron G6X.

A série RTX 30 é feita usando Samsung 8N Nvidia Custom Process com 28 bilhões de transistores para GA102 e 17 bilhões de transistores para GA104. A classe Titan RTX 3090 é alimentada pela GPU GA102 e oferece desempenho de cartão de consumidor extremamente poderoso. Ao contrário das gerações anteriores, o RTX 3090 está aberto a terceiros para design personalizado.

O RTX 3080 também está usando uma GPU GA102, oferecendo o dobro do desempenho do RTX 2080 e uma impressionante proeza em jogos 4K. RTX 3070, equipado com GPU GA104, está no mesmo nível do RTX 2080 Ti pela metade do preço. O recém-lançado RTX 3060 também nunca deixa de impressionar com seu incrível desempenho impulsionado por Ray Tracing Cores, Tensor Cores, novos multiprocessadores de streaming e memória G6 de alta velocidade.

Apesar do grande aumento no desempenho, as novas GPUs RTX não pesam no bolso. As placas gráficas muito mais rápidas são facilmente acessíveis quando se trata de preços. O carro-chefe da Nvidia GeForce, RTX 3080, começa em $ 699, o RTX 3070 é vendido a $ 499 e o RTX 3060 tem um preço de $ 329. O RTX 3090 de última geração custa US $ 1.499; ainda consideravelmente de baixo custo, considerando seu desempenho de nível Titan.

Poucos meses após seu lançamento, supostamente tem havido uma escassez de placas gráficas baseadas em Ampere, e não é nenhuma surpresa com o desempenho impressionante do Ampere a um preço razoável. Para aqueles que estão considerando uma atualização de GPU, agora é o melhor momento para colocar suas mãos nas GPUs baseadas em Ampere da Nvidia.

Origens

[1] Walton, Jarred. “Mergulho profundo na arquitetura Ampere da série Nvidia RTX 30: tudo o que sabemos”. https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 13 de outubro de 2020.