
Эпоха Vera Rubin: новый суперчип NVIDIA меняет правила игры в мире искусственного интеллекта
На конференции GTC 2025 в Вашингтоне NVIDIA представила то, что уже называют важнейшим шагом в развитии ИИ-инфраструктуры — суперчип нового поколения под названием Vera Rubin. Компания впервые показала «материнскую плату будущего», где объединены процессор Vera и два огромных графических ускорителя Rubin. Это не просто демонстрация мощности — это взгляд в то, каким станет центр обработки данных через пару лет.
### Архитектура и технологии
Новый процессор Vera CPU основан на архитектуре ARM и имеет 88 кастомных ядер с поддержкой 176 потоков. Между CPU и GPU используется обновлённый интерфейс NVLink C2C со скоростью до 1,8 ТБ/с. Графические чипы Rubin производятся на фабриках TSMC и включают по два ретикульных кристалла, каждый из которых оснащён восемью блоками памяти HBM4. На самой системной плате размещено 32 разъёма под оперативную LPDDR-память, что обеспечивает колоссальную пропускную способность данных даже на уровне материнской платы.
Первая система на базе этой платформы получила название NVL144. Она объединяет 144 графических модуля Rubin и демонстрирует до 3,6 экзафлопс производительности в FP4-режиме при выполнении задач ИИ-инференса и 1,2 экзафлопс при обучении в FP8. Это более чем втрое превосходит актуальные показатели платформы Blackwell Ultra NVL72. Общая скорость передачи данных в памяти достигает 13 ТБ/с, а «быстрой» памяти в системе — 75 ТБ. Пропускная способность NVLink оценивается в 260 ТБ/с, а сетевого интерфейса CX9 — в 28,8 ТБ/с.
### Rubin Ultra и путь к экза-масштабу
Во второй половине 2027 года ожидается выход платформы NVL576 Rubin Ultra. Здесь количество GPU увеличится до 576, каждый получит уже по четыре кристалла Rubin. Производительность системы достигнет 15 экзафлопс при FP4-инференсе и 5 экзафлопс при FP8-обучении. Общий объём HBM4e-памяти составит 1 ТБ, а пропускная способность — 4,6 ПБ/с. NVLink вырастет до 1,5 ПБ/с, CX9 — до 115 ТБ/с. Это демонстрирует стремление NVIDIA не просто повышать мощность, а строить масштабируемые вычислительные экосистемы для будущего ИИ.
### Зачем всё это нужно
Главная идея — объединить CPU и GPU под одним «архитектурным зонтиком». Это позволит минимизировать задержки при обмене данными, повысить эффективность и снизить энергозатраты. Разработчики отмечают, что новая платформа создавалась специально под нужды генеративных моделей, систем симуляции и ИИ-обработки данных. По сути, Vera Rubin стирает границы между вычислениями, памятью и коммуникацией внутри дата-центра.
### Производство и реализация
По словам Дженсена Хуана, массовое производство Rubin начнётся в третьем или четвёртом квартале 2026 года, а Rubin Ultra выйдет во второй половине 2027-го. Поставщики готовятся к новым требованиям: система потребляет до 600 кВт на стойку, а это значит, что без продвинутого охлаждения и мощных блоков питания не обойтись. Очевидно, что будущее дата-центров становится всё более энергоёмким и требовательным.
### Сильные и слабые стороны
Нужно учитывать, что цифры, которыми делится NVIDIA, основаны на FP4 и FP8 — форматах, адаптированных под ИИ-задачи, а не под традиционные вычисления с двойной точностью FP64. Поэтому суперкомпьютеры на этой архитектуре не предназначены для классических HPC-нагрузок, где требуется высокая точность, но идеально подходят для нейросетей и генеративных моделей. Пока остаются вопросы к выходу на рынок, теплоотведению и стоимости, но общая тенденция очевидна: компания делает ставку на ИИ-платформы нового типа.
### Конкуренты и рынок
AMD, по слухам, готовит собственную серию MI-ускорителей с производительностью до 2–3 экзафлопс, но Rubin Ultra уже сегодня обещает пятикратный запас по мощности. Аналитики отмечают, что NVIDIA фактически задаёт стандарт для всей отрасли. Теперь даже гиганты облачных вычислений вынуждены подстраиваться под новую реальность, где «железо для ИИ» становится отдельным классом вычислительной техники.
Vera Rubin — это не просто очередная линейка ускорителей. Это заявление о будущем, где всё подчинено одной цели: дать ИИ-моделям неограниченные ресурсы для обучения, анализа и созидания. И если сейчас эти стойки выглядят как из научной фантастики, то через пару лет они станут новым стандартом индустрии.