Las computadoras portátiles de la serie RTX 40 de Nvidia no son un buen augurio para las GPU de escritorio RTX 4060, 4050

La arquitectura Ada Lovelace de Nvidia marca el comienzo de un nuevo nivel de rendimiento en la parte superior de la pila, con el RTX 4090 superando al RTX 3090 Ti de la generación anterior en un promedio del 52 % en nuestros puntos de referencia de rasterización y un 70 % en los puntos de referencia de lanzamiento. 4K, naturalmente. La 4090 ahora se encuentra cómodamente en la parte superior de nuestra jerarquía de referencia de GPU y se encuentra entre las mejores tarjetas gráficas, al menos si tiene mucho dinero.

Desafortunadamente, el cambio del 4090 al RTX 4080 es bastante apresurado, lo que reduce el rendimiento en un 23 % para la rasterización y en un 30 % para el trazado de rayos. Bajar otro nivel a la nueva RTX 4070 Ti reduce el rendimiento en un 22 % con respecto a la 4080. Si realiza un seguimiento, y realmente nos gusta llevar la cuenta, eso significa que la tarjeta Ada de tercera serie con la GPU AD104 es más lenta que la generación anterior. 3090 Ti, independientemente de las afirmaciones de Nvidia en sentido contrario que se basan en puntos de referencia que utilizan la generación de cuadros DLSS 3.

Quizás lo más alarmante del RTX 4070 Ti es que solo tiene una interfaz de memoria de 192 bits. Todavía tiene 12 GB de memoria GDDR6X, y el gran caché L2 en general significa que el bus más angosto no es un problema, pero las cosas no se ven tan bien cuando miramos a las partes futuras de la serie. 4060 y 4050.

Nvidia anunció recientemente la línea completa de GPU para portátiles de la serie RTX 40, que van desde la RTX 4090 móvil que usa la GPU AD103 (esencialmente una 4080 móvil) hasta la RTX 4050 con sonido anémico. Aquí está la lista completa de especificaciones para piezas móviles.

Desliza para desplazarte horizontalmente
Especificaciones de GPU para portátiles Nvidia Ada
Tarjeta gráfica RTX 4090 para portátiles RTX 4080 para portátiles RTX 4070 para portátiles RTX 4060 para portátiles RTX 4050 para portátiles
Arquitectura AD103 AD104 AD106? AD106? AD107?
Proceso tecnológico TSMC4N TSMC4N TSMC4N TSMC4N TSMC4N
Transistores (miles de millones) 45,9 35.8 ? ? ?
Tamaño del troquel (mm^2) 378.6 294.5 ? ? ?
SMS 76 58 36 24 20
Sombreadores de GPU 9728 7424 4608 3072 2560
Núcleos tensoriales 304 232 144 96 80
Trazado de rayos "núcleos" 76 58 36 24 20
Reloj de impulso (MHz) 1455-2040 1350-2280 1230-2175 1470-2370 1605-2370
Velocidad VRAM (Gbps) 18? 18? 18? 18? 18?
VRAM (GB) dieciséis 12 8 8 6
Ancho del bus VRAM 256 192 128 128 96
caché L2 64 48 32 32 24
Redox 112 80 48 32 32
TMU 304 232 144 96 80
TFLOPS FP32 (impulso) 28,3-39,7 20,0-33,9 11.3-20.0 9.0-14.6 8.2-12.1
TFLOPS FP16 (FP8) 226-318 (453-635) 160-271 (321-542) 91-160 (181-321) 72-116 (145-233) 66-97 (131-194)
Ancho de banda (GBps) 576 432 288 288 216
TDP (vatios) 80-150 60-150 35-115 35-115 35-115

Es una apuesta segura que la computadora de escritorio RTX 4070 usará el mismo AD104 que la RTX 4070 Ti, solo que con menos SM y shaders. Desktop RTX 4060 Ti, suponiendo que lo consigamos pronto, puede o no usar AD104; la única otra opción probablemente sería la GPU AD106 utilizada en el rover 4070/4060. Y eso es un problema.

La generación anterior de RTX 3060 Ti venía con 8 GB de GDDR6 en una interfaz de 256 bits. No estábamos particularmente contentos con la falta de VRAM, especialmente cuando AMD comenzó a comercializar la RX 6700 XT (y luego la 6750 XT) con 12 GB de VRAM. Básicamente, Nvidia hizo una corrección de rumbo con el RTX 3060 y le dio 12 GB de VRAM, lo que lo convierte en un buen paso adelante del RTX 2060 anterior, e incluso el 2060 finalmente vio modelos de 12 GB, aunque los precios los hicieron en su mayoría poco atractivos.

Ahora estamos hablando de RTX 4060, que probablemente bajará a 8 GB, y eso apestaría. Ahora hay muchos juegos que pueden exceder los 8 GB de uso de VRAM, y ese número solo aumentará en los próximos años. Pero Nvidia no tiene muchas otras opciones, ya que las capacidades de memoria GDDR6 y GDDR6X tienen un límite de 2 GB por canal de 32 bits.

Es posible hacer el modo clamshell con dos chips de memoria por canal, uno a cada lado de la PCB, pero eso es bastante complicado y no es algo que esperaríamos ver en una GPU de consumo. Esto podría llevar la interfaz de 128 bits hasta 16 GB de VRAM, lo que nuevamente sería extraño ya que las partes de nivel superior como el 4070 Ti solo tienen 12 GB. Aún así, eso suena mejor que un modelo RTX. ¡4060 8 GB para mí!

¿Y qué hay de la RTX 4050? Tal vez Nvidia se quede con la interfaz de 128 bits en la GPU AD106 y no use AD107 en una parte de escritorio, eso es básicamente lo que sucedió con GA107, que se usó casi exclusivamente para la computadora portátil l RTX 3050. Pero si intenta usar AD107 en una computadora de escritorio , solo tendría hasta 6 GB de VRAM, nuevamente con VRAM clamshell como una salida potencial.

diagrama de bloques AD104

La misma GPU AD104 se encuentra dentro de la tarjeta de escritorio RTX 4070 Ti de Nvidia, así como en la próxima solución para computadora portátil RTX 4080. (Crédito de la imagen: Hardware de Tom)

No son solo las habilidades de memoria las que causan preocupación. Dijimos en la revisión de la RTX 4070 Ti que el rendimiento no era malo, pero tampoco sorprendente. Básicamente es una versión más económica de un RTX 3090, con la mitad de VRAM y un menor consumo de energía. El 4070 Ti se las arregla con 60 multiprocesadores de transmisión (SM) y 7680 núcleos CUDA (sombreadores de GPU), que es un poco más que el RTX 3070 Ti saliente. Pero el AD106 podría alcanzar solo 40 SM, tal vez incluso 36 SM, lo que lo colocaría en un territorio similar al RTX 3060 Ti en el recuento de núcleos, dejando solo los relojes de GPU como un impulso de rendimiento.

Ponga esas dos cosas juntas: VRAM insuficiente y aumentos relativamente menores en el recuento de sombreadores de GPU, y probablemente estemos viendo mejoras modestas en el rendimiento con respecto a las GPU Ampere de la generación anterior.

Luego, Nvidia lanzará las mejoras de rendimiento de DLSS 3, que solo se aplican a un subconjunto de juegos y tampoco ofrecen mejoras de rendimiento reales, y las cosas comienzan a verse aún peor. Parte del beneficio de tener una GPU que puede ejecutar juegos a 120 fps hoy es que, a medida que los juegos se vuelvan más exigentes, aún podrá hacerlo a 60 fps en la mayoría de los juegos dentro de algunos años. Pero, ¿qué pasa cuando no es real velocidades de fotogramas?

Controlador de juego Nvidia DLSS3

(Crédito de la imagen: Nvidia)

Supongamos que un juego se ejecuta a 120 fps con la tecnología DLSS 3 Frame Generation, con un rendimiento base de 70 fps. Todo está bien por ahora, pero en el futuro, el rendimiento de referencia caerá por debajo de los 40 fps a medida que los juegos se vuelvan más exigentes y eventualmente caerá por debajo de los 30 fps. Lo que encontramos es que la generación de fotogramas con una velocidad de fotogramas base de menos de 30 fps todavía parece menos de 30 fps, aunque el monitor recibe el doble de actualizaciones de fotogramas por segundo.

Esta misma lógica también se aplica a velocidades de cuadro más altas, por lo que DLSS 3 a 120 fps con una base de 70 fps seguirá pareciendo 70 fps, incluso si se ve un poco más suave a la vista. La mayoría de las personas no podrán notar la diferencia entre las tasas de entrada de 70 muestras por segundo y las entradas de 120 muestras por segundo. Pero cuando comienzas a caer por debajo de 40, incluso los jugadores no profesionales comenzarán a sentir la diferencia.

O para decirlo sin rodeos: DLSS 3 y Frame Generation no son una panacea. Pueden ayudar a suavizar las imágenes y tal vez mejorar un poco la sensación de los juegos, pero el beneficio no será tan notable como las imágenes totalmente renderizadas reales teniendo en cuenta la nueva entrada del usuario, especialmente cuando el rendimiento cae por debajo de 60 fps.

Eso no quiere decir que sea mala tecnología, en realidad es bastante inteligente, y no nos importa que exista. Pero Nvidia debe dejar de comparar las puntuaciones de DLSS 3 con los resultados que no son de DLSS 3 y actuar como si fuera lo mismo. Tome la velocidad de fotogramas base antes de la Generación de fotogramas y agregue tal vez un 10-20% y así es como se ve un juego, no los 60-100% fps más altos que mostrarán los puntos de referencia.

Volviendo al tema, las futuras GPU estándar y económicas de la serie RTX 40 sin duda superarán a los modelos existentes en términos de rendimiento absoluto, y también contarán con soporte DLSS 3. Con suerte, Nvidia volverá a precios más cercanos a la generación anterior, porque si el RTX 4060 cuesta $ 499 y el RTX 4050 cuesta $ 399, terminarán siendo actualizaciones menores sobre las tarjetas existentes a estos precios.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir