Главная » Новости » GPU NVIDIA Rubin CPX: новый уровень для миллион-токенных ИИ и генеративного видео

GPU NVIDIA Rubin CPX: новый уровень для миллион-токенных ИИ и генеративного видео

by texno.org
0 коммент 2 просмотров
GPU NVIDIA Rubin CPX: новый уровень для миллион-токенных ИИ и генеративного видео

GPU NVIDIA Rubin CPX: новый уровень для миллион-токенных ИИ и генеративного видео

NVIDIA снова подняла планку в гонке вычислительных мощностей для искусственного интеллекта, представив Rubin CPX — графический процессор, созданный специально для задач, которые раньше казались невозможными. От ассистентов программирования с поддержкой миллионов токенов до генеративного видео высокой четкости — Rubin CPX не просто очередное обновление, а совершенно новый класс GPU, ориентированный на работу с огромными контекстами.

Rubin CPX входит в состав широкой платформы Rubin, куда также входят процессоры Vera и сетевые адаптеры ConnectX-9 SuperNIC. Всё это объединяется в системе NVIDIA Vera Rubin NVL144 CPX — мощной MGX-платформе для дата-центров. NVIDIA заявляет, что этот «шкаф» способен выдавать 8 экзафлопс вычислений ИИ, что в 7,5 раза выше возможностей GB300 NVL72. Дополняют систему 100 ТБ быстрой памяти и пропускная способность 1,7 петабайта в секунду.

Главное отличие Rubin CPX — акцент на долгий контекст. Для ассистентов программирования это означает переход от простого автодополнения к полноценному пониманию и оптимизации масштабных проектов с миллионами строк кода. В области видео новая архитектура позволяет моделям ИИ обрабатывать до миллиона токенов за один час контента. Это критически важно для генеративного видео и поиска по длинным роликам, где стандартные GPU быстро упираются в ограничения.

Чтобы справиться с такой нагрузкой, Rubin CPX совмещает NVFP4-блоки вычислений с интегрированными кодеками видео, объединяя всё это в одном монолитном кристалле. В отличие от других представителей линейки Rubin, которые используют несколько «ретикловых» сборок (две у Rubin и четыре у Rubin Ultra), CPX полагается на цельную структуру ради эффективности и оптимизации затрат. Интересно, что NVIDIA выбрала GDDR7 вместо HBM: до 128 ГБ видеопамяти GDDR7 дают отличное соотношение цена/производительность и обеспечивают достаточную пропускную способность для задач инференса.

Если говорить цифрами, Rubin CPX выдаёт 30 PFLOPs NVFP4 вычислений ИИ на один GPU. В составе полной системы NVL144 CPX это превращается в рекордные 8 экзафлопс, плюс 3-кратное ускорение внимания по сравнению с GB300 NVL72. То есть NVIDIA сделала не эволюционный шаг, а радикальный скачок.

Для сравнения: стандартная платформа Vera Rubin NVL144 без CPX, где стоят четыре Rubin GPU и два Vera CPU, обеспечивает 3,6 экзафлопс, 75 ТБ памяти и 1,4 ПБ/с пропускной способности. CPX-версия увеличивает показатели почти вдвое и выше: 8 экзафлопс, 100 ТБ памяти и 1,7 ПБ/с. Разрыв колоссальный.

Не менее важна и видеочасть. Rubin CPX получил в четыре раза больше блоков NVENC и NVDNC, что делает его идеальным инструментом для генеративных задач — от синтетических обучающих данных до сложного видео на лету. С учётом роста интереса к ИИ-контенту это одно из ключевых преимуществ платформы.

По планам NVIDIA, первые системы Rubin CPX появятся к концу 2026 года, а обычная Rubin NVL144 — немного раньше, во второй половине 2026-го. В дальнейшем компания обещает Rubin Ultra и даже намекнула на платформу Feynman. Технологический процесс пока не подтверждён, но аналитики ожидают использование передовых техпроцессов TSMC N3 или N2.

Для разработчиков и компаний Rubin CPX означает больше, чем просто обновление. Это новая парадигма: GPU, созданные специально для задач, где требуется обрабатывать невероятно большие объёмы данных за один проход. От оптимизации миллионов строк кода до генеративного видео и масштабных языковых моделей — Rubin CPX открывает дорогу будущим приложениям ИИ.

Очевидно одно: NVIDIA не намерена останавливаться на успехах Grace Blackwell. Rubin CPX показывает, что компания целится в задачи завтрашнего дня — задачи, где важны не только скорость и память, но и способность работать с беспрецедентными контекстами.

Еще статьи по теме

Оставьте комментарий