- Rubin Ultra será la GPU tope de la familia Vera Rubin, apuntada para finales de 2026.
- Arquitectura multi-matriz con recuento por matrices y expectativa de cuatro chips de tamaño retícula.
- Memoria HBM4 en configuración 12S para más capacidad y ancho de banda.
- Integración en la plataforma Vera Rubin con NVLink 6, CPU Vera y redes Spectrum-6, complementando a Rubin CPX.
NVIDIA afina la siguiente gran evolución de su ecosistema de centro de datos con Rubin Ultra, la GPU que coronará la familia Vera Rubin. Aunque la compañía no ha publicado aún la ficha completa, las pistas oficiales y menciones en eventos recientes dibujan un panorama bastante concreto y coherente.
Este procesador gráfico se situará por encima de Rubin “estándar” y tomará el testigo de Blackwell Ultra dentro del ciclo anual de iteración arquitectónica. La meta es sostener modelos más grandes y contextos extensos sin renunciar a eficiencia ni a la escalabilidad necesaria para despliegues empresariales.
Arquitectura y formato multi‑matriz
NVIDIA está migrando su nomenclatura hacia un esquema que refleja el recuento de matrices (dies), un cambio que encaja con lo que se espera de Rubin Ultra: cuatro matrices de tamaño retícula integradas en un único paquete de alto rendimiento.
Este enfoque MCM permite repartir el cómputo y la memoria a través de varios chips, reduciendo cuellos de botella y mejorando el rendimiento por vatio. La interconexión de estas matrices se apoyará en NVLink de sexta generación, clave para el encaje de Rubin Ultra dentro de los racks VR NVL144 de la plataforma.
Memoria HBM4 de alta densidad
La hoja de ruta pública indica que Rubin empleará HBM4 en módulos de alta densidad y que Rubin Ultra daría el salto a 12S HBM4, incrementando de forma notable la capacidad total y el ancho de banda disponibles respecto a la configuración 8S prevista para Rubin.
Más capacidad y mayor banda se traducen en ventanas de contexto ampliadas, lotes más grandes y menor presión sobre el almacenamiento intermedio del sistema. Esto resulta especialmente valioso en modelos de lenguaje de contexto largo y en cargas de entrenamiento e inferencia que alternan fases intensivas en cómputo con fases limitadas por memoria.
Encaje en la plataforma Vera Rubin
Rubin Ultra se integrará en una plataforma que renueva CPU, red y conmutación. Destacan la CPU “Vera” (88 núcleos/176 hilos) con enlaces C2C duplicados hasta 1.800 GB/s, el NVLink 6 con 3.600 GB/s bidireccionales y el switch Spectrum-6 con óptica coempaquetada para reducir latencias y mejorar la eficiencia energética.
La base de rack seguirá siendo Oberon, común a generaciones anteriores (Grace Hopper, Grace Blackwell), lo que debería facilitar una transición con menos fricción a operadores que quieran incorporar Rubin Ultra a infraestructuras ya desplegadas.
Especialización y rol junto a Rubin CPX
Como complemento dentro del mismo ecosistema, NVIDIA introdujo Rubin CPX, un acelerador enfocado al procesamiento de contexto en LLM con 128 GB de GDDR7. Su papel es descargar tareas muy intensivas en memoria (caché KV), permitiendo que Rubin Ultra concentre el cómputo de alto rendimiento.
En arquitecturas mixtas, el prefill intensivo en cálculo puede recaer en Rubin Ultra, mientras que la decodificación —más limitada por ancho de banda de memoria— se deriva a CPX. La orquestación se apoya en software como Dynamo y TensorRT‑LLM para mover datos y trabajo entre componentes de forma transparente.
Calendario y lo que falta por conocer
NVIDIA sitúa la generación Vera Rubin para la segunda mitad de 2026 en el ámbito empresarial y, dentro de ese marco temporal, Rubin Ultra figura para finales de ese año. La ventana de lanzamiento podría ajustarse conforme avance la validación y la cadena de suministro.
Quedan por confirmar especificaciones finas como recuento de SM, frecuencias, consumo, opciones de red y posibles variantes pensadas para distintas densidades de rack. Especificaciones detalladas suelen desvelarse más cerca de la producción.
Impacto esperado en centros de datos
Si se confirman las claves adelantadas —cuatro matrices y HBM4 12S—, Rubin Ultra elevaría el techo de rendimiento por nodo y habilitaría ventanas de contexto de millones de tokens con costes operativos más contenidos gracias a la especialización de la pila hardware‑software.
Combinado con NVLink 6, Spectrum‑6 y las CPU Vera, el ecosistema apunta a instalaciones de escala de gigavatios, apoyadas en gemelos digitales de Omniverse para planificar energía, refrigeración y carga de trabajo antes del despliegue físico.
Rubin Ultra se perfila como la iteración tope de gama de Vera Rubin: paquete multi‑matriz y memoria HBM4 12S para dar cabida a modelos y contextos mayores, integrado en una plataforma que moderniza CPU, redes y racks con el objetivo de subir el listón del rendimiento y la eficiencia.