CoreWeave показала, на что способен новый NVIDIA GB300 NVL72 на архитектуре Blackwell, и результаты впечатляют. В тестах на модели DeepSeek R1 этот суперчип продемонстрировал в 6 раз более высокую производительность на каждый GPU по сравнению с H100. Особенно примечательно, что задачу, требовавшую ранее кластер из 16 H100, удалось выполнить всего на 4 GB300.

Главное преимущество кроется в архитектуре: сокращение тензорного параллелизма с 16 до 4 существенно уменьшает издержки на обмен данными между GPU. Добавьте к этому огромную память и колоссальную пропускную способность, и становится ясно, почему GB300 справляется с тяжёлой нагрузкой так легко. Интерконнекты NVLink и NVSwitch обеспечивают обмен данными со скоростью 130 ТБ/с, а система NVL72 даёт 37 ТБ памяти (и масштабируется до 40 ТБ).
Для компаний это означает более быстрое генерирование токенов, меньшие задержки и снижение расходов при росте производительности. Демонстрация CoreWeave наглядно показывает: GB300 — это не только brute force в терафлопсах, но и более изящное, простое и экономичное решение для сложных AI-задач. Кластеры на H100 остаются актуальными, но поколение Blackwell с GB300 задаёт совершенно новый уровень в обучении и инференсе моделей.