Главная » Новости » У NVIDIA RTX 5090 и RTX PRO 6000 выявлен баг виртуализации, требующий перезагрузки системы

У NVIDIA RTX 5090 и RTX PRO 6000 выявлен баг виртуализации, требующий перезагрузки системы

by texno.org
0 коммент 2 просмотров

Флагманские видеокарты NVIDIA GeForce RTX 5090 и RTX PRO 6000 столкнулись с неожиданной проблемой, которая уже вызвала бурное обсуждение среди специалистов по виртуализации. Сообщается, что при работе в среде виртуальных машин эти GPU могут полностью зависать и перестают откликаться, а восстановить их можно только после перезагрузки всего хоста.

У NVIDIA RTX 5090 и RTX PRO 6000 выявлен баг виртуализации, требующий перезагрузки системы

Первыми тревогу забили инженеры облачного сервиса CloudRift, предоставляющего разработчикам и исследователям ИИ доступ к GPU. По их словам, через несколько дней работы в виртуальных машинах новые ускорители становятся «мертвыми» и перестают отвечать. Никакие программные сбросы не помогают — приходится перезагружать сервер целиком, что критично при большом количестве гостевых ВМ и серьезно влияет на стабильность.

Проблема проявляется в связке с VFIO-пасстру и механизмом Function Level Reset (FLR). После FLR карты RTX 5090 и RTX PRO 6000 не возвращаются к нормальной работе, что приводит к так называемой «мягкой блокировке» ядра и стопорит и хост, и гостевые системы. Любопытно, что предыдущие модели, включая RTX 4090, Hopper H100 и Blackwell B200, от подобных проблем свободны. Всё указывает на сбой именно в новой линейке Blackwell.

И это не единичный случай CloudRift. Пользователи Proxmox также сообщают о схожих зависаниях, в том числе о полном краше хоста после завершения работы Windows-гостя. Сходство историй указывает на системный сбой драйвера или прошивки, а не на ошибки администраторов.

CloudRift даже объявил вознаграждение в $1000 тому, кто предложит рабочее решение. Сумма выглядит скорее символической на фоне триллионной капитализации NVIDIA, что вызвало волну сарказма в сообществе. Многие считают, что такие баги компания должна устранять мгновенно, а не ждать месяцами, как это бывало с драйверами.

Представители NVIDIA уже признали, что проблема воспроизводится в их лабораториях, и работают над исправлением. Однако пока официальный патч не вышел, владельцы RTX 5090 и RTX PRO 6000 остаются заложниками ситуации: перезагрузка целого сервера ради восстановления GPU — крайне неприятная перспектива, особенно для облачных провайдеров и тех, кто рассчитывает на круглосуточную доступность.

Ситуация вновь поднимает вопрос надежности NVIDIA в профессиональных средах. Часть энтузиастов уже шутит, что у AMD таких проблем нет, хотя у Radeon и свои ограничения. Другие уверены, что через какое-то время драйвер все же поправят, но репутационный осадок останется.

Пока же RTX 5090 и RTX PRO 6000 на бумаге выглядят как мощные решения, но для виртуализации их стоит использовать осторожно. До выхода исправлений можно столкнуться не с «революцией в ИИ», а с банальными перезагрузками серверов.

Еще статьи по теме

Оставьте комментарий