NVIDIA и OpenAI запустили gpt-oss — ИИ-модели с рекордной скоростью на RTX

by texno.org 06.08.2025

06.08.2025 2 комментария 19 просмотров

Самое важное ▼

NVIDIA совместно с OpenAI представила линейку открытых AI-моделей gpt-oss, которые теперь можно запускать прямо на домашних ПК с видеокартами RTX. Это важный шаг — передовые нейросети, которые раньше требовали облачных дата-центров, теперь доступны всем без подписок и задержек.

NVIDIA и OpenAI запустили gpt-oss — ИИ-модели с рекордной скоростью на RTX

В линейку входят две модели: gpt-oss-20b, оптимизированная под обычные RTX-компьютеры с 16+ ГБ видеопамяти, и мощная gpt-oss-120b, рассчитанная на профессиональные станции с RTX PRO. Младшая модель на RTX 5090 способна выдавать до 250 токенов в секунду — быстрее, чем ты успеешь прочитать.

Обе модели обучены на ускорителях NVIDIA H100 и используют новый формат MXFP4, который повышает точность и качество генерации без потери скорости. Также поддерживается контекст длиной до 131 072 токенов — один из самых длинных среди локальных ИИ.

Модель построена по архитектуре Mixture of Experts (MoE) с поддержкой пошагового мышления, выполнения инструкций и инструментов.

Запустить всё это проще простого благодаря:

Ollama App — интуитивный интерфейс, где всё готово для gpt-oss и работает на RTX «из коробки».
Llama.cpp — NVIDIA помогает сообществу ускорять производительность, добавляя такие фичи, как CUDA Graphs.
Microsoft AI Foundry — в Windows можно стартовать модель командой прямо в терминале.

Глава NVIDIA Дженсен Хуанг отметил: «gpt-oss открывает доступ к передовым ИИ-инструментам на базе крупнейшей в мире платформы ИИ-вычислений».

Пусть кто-то и жалуется на старый 5нм техпроцесс в RTX 5000, но новая реальность локального ИИ с такими скоростями — это революция. Без облаков. Без задержек. Только ты и твой RTX.

Вам также может заинтересовать:

Источник: https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss https://openai.com/index/introducing-gpt-oss/ https://www.nvidia.com/en-us/data-center/h100/ https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss https://ollama.com/blog/new-app https://github.com/ggml-org/llama.cpp https://azure.microsoft.com/en-us/products/ai-foundry

предыдущий пост

PS6 против Xbox Next: Утечки говорят о схожей с 9070XT и RTX 5080 производительности

следующий прост

Акции Figma падают, Palantir набирает ход: шутка Крамера попала в точку

Еще статьи по теме

2 комментария

Speculator3000 13.10.2025 - 18:01

ну RTX и так был топом, просто теперь это официально

Ответ

DeltaForce 25.11.2025 - 06:14

медленно? брат, у тебя, походу, оперативка из картона 🙄

Ответ

Оставьте комментарий Отменить ответ

Andy
иконки новые не очень, старые были лучше
404NotFound
опять эти сказки про 50x прирост, как с ртх карточками лол
DevDude007
две камеры по 200 мп? это жесть 😳
FaZi
Теперь, если комп ломается, все такие: 'Ну да, я это не починю.'
DeltaForce
медленно? брат, у тебя, походу, оперативка из картона 🙄
LunaLove
выглядит круто, но разобьётся же моментально 😅
SnapSavvy
очень люблю Nothing OS, но ощущение, что во всех Lite они режут самое интересное железо, а потом удивляются, почему все хвалят именно…
FaZi
В XR я вообще не понимаю, чем это лучше VR... 😒
Rooter
наконец-то! эппл давно перегибает палку 🤦
Virtuoso
Согласен, если чехол не сильно увеличит толщину, то может быть полезным на тех же поездках. Хотя будет странно носить айфон в таком…