Nvidia revela los secretos de la GPU de Ada Lovelace: recuentos extremos de transistores a altas velocidades de reloj

Cuando Nvidia presentó su familia de unidades de procesamiento de gráficos Ada Lovelace a principios de esta semana, se centró principalmente en su GPU AD102 de gama alta y la tarjeta gráfica insignia GeForce RTX 4090. No reveló demasiados detalles sobre sus chips gráficos AD103 y AD104. Afortunadamente, Nvidia ha publicado hoy su documento técnico de Ada Lovelace, que contiene una gran cantidad de datos sobre las nuevas GPU y llena muchos de los vacíos. Hemos actualizado las GPU de la serie RTX 40, todo lo que sabemos, con los nuevos detalles, pero aquí está el resumen de información nueva e interesante.

Índice
  1. Grandes GPU para grandes juegos
  2. Más transistores = más rendimiento
  3. Más SKU entrantes
  4. Algunas ideas

Grandes GPU para grandes juegos

Ya sabemos que la AD102 de gama alta de Nvidia es una GPU de 608 mm^2 equipada con 76 300 millones de transistores, 18 432 núcleos CUDA y 96 MB de caché L2. También sabemos que la AD103 es una GPU de 378,6 mm^2 con 45.900 millones de transistores, 10 240 núcleos CUDA y 64 MB de caché L2. En cuanto a la AD104, tiene un tamaño de matriz de 294,5 mm^2, 35 800 millones de transistores, 7680 núcleos CUDA. y 48 MB de L2.

Especificaciones de Nvidia Ada vs Ampere
GPU/tarjeta gráfica AD102 completo RTX-4090 RTX 4080 16GB RTX 4080 12GB RTX-3090Ti
Arquitectura AD102 AD102 AD103 AD104 GA102
Proceso tecnológico TSMC4N TSMC4N TSMC4N TSMC4N Samsung 8LPP
Transistores (miles de millones) 76.3 76.3 45,9 35.8 28.3
Tamaño del troquel (mm^2) 608 608 378.6 294.5 628.4
Multiprocesadores de transmisión 144 128 76 60 84
Núcleos de GPU (sombreadores) 18432 16384 9728 7680 10752
Núcleos tensoriales 576 512 320 240 336
Núcleos de trazado de rayos 144 144 80 60 84
TMU 512 512 304? 240 336
Redox 192 192 112 80 112
Caché L2 (MB) 96 96 64 48 6
Reloj de impulso (MHz) ? 2520 2505 2600 1860
TFLOPS FP32 (impulso) ? 82.6 48.7 40.1 40,0
TFLOPS FP16 (FP8) ? 661 (1321) 390 (780) 319 (639) 320 (N/D)
Trazado de rayos TFLOPS ? 191 113 82 78.1
Interfaz de memoria (bit) 384 384 256 192 384
Velocidad de memoria (GT/s) ? 21 22.4 21 21
Ancho de banda (GBps) ? 1008 736 504 1008
TDP (vatios) ? 450 320 285 450
Fecha de lanzamiento ? 12 de octubre de 2022 noviembre de 2022? noviembre de 2022? marzo 2022
precio de lanzamiento ? $1,599 $1,199 $899 $1,999

Una de las cosas interesantes de las que habla Nvidia en su libro blanco es que las GPU Ada Lovelace usan transistores de alta velocidad en rutas críticas para aumentar las velocidades máximas de reloj. Como resultado, su GPU AD102 totalmente habilitada con 18 432 núcleos CUDA es "capaz de funcionar a velocidades superiores a 2,5 GHz, manteniendo el mismo TGP de 450 W". Teniendo eso en cuenta, no nos sorprende que la empresa esté hablando de relojes de 3,0 GHz para la GeForce RTX 4090 (con 16 384 núcleos CUDA) logrados en sus laboratorios. A 3,0 GHz, la GeForce RTX 4090 encabezará absolutamente nuestra lista de las mejores tarjetas gráficas del mercado.

(Crédito de la imagen: Nvidia)

Además de los relojes altos, la GPU Ada Lovelace de Nvidia también cuenta con enormes cachés L2 que mejoran el rendimiento en cargas de trabajo de cómputo intensivo (por ejemplo, trazado de rayos, seguimiento de rutas, simulaciones, etc.) y reducen los requisitos de ancho de banda de la memoria. Esencialmente, las GPU Ada de Nvidia aquí se inspiran en el libro 2 Infinity Cache de RDNA, aunque creemos que los objetivos generales para la nueva arquitectura se establecieron mucho antes de que se lanzaran los productos de la serie Radeon RX 6000 de AMD en 2020.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir