Microsoft наконец представила собственные ИИ-модели, делая серьезный шаг в сторону самостоятельности и конкуренции с OpenAI. Компания показала два проекта: MAI-Voice-1 и MAI-1-preview, которые должны изменить представление о возможностях голоса и текста в искусственном интеллекте.

Главный фокус — MAI-Voice-1, речевая модель, способная создать минуту реалистичной речи менее чем за секунду и при этом использовать всего один GPU. Голос звучит настолько естественно, что отличить его от живого человека практически невозможно. Уже сейчас эта технология работает в Copilot Daily, где «ведущий» ИИ зачитывает новости, а также в формате подкастов с объяснением сложных тем. Желающие могут протестировать модель через Copilot Labs, меняя голос, тембр и стиль речи.
Вторая новинка — MAI-1-preview, огромная языковая модель, обученная на кластере из 15 000 видеокарт Nvidia H100. Она предназначена для работы с текстом: понимания инструкций, ответов на вопросы и помощи в повседневных задачах. Microsoft уже тестирует её на публичном сайте LMArena и готовится встроить в Copilot.
Амбиции компании прозрачны: создать целую экосистему специализированных ИИ, которые смогут решать разные задачи в тандеме. Это значит, что теперь Microsoft конкурирует не только с Google, но и с собственным партнером — OpenAI. Напомним, недавно OpenAI выпустила ChatGPT 5, универсальную систему, способную балансировать между короткими ответами и экспертными объяснениями.
В стороне не остался и Google: команда DeepMind презентовала модель редактирования изображений с забавным названием «nano banana», которая сохраняет внешность пользователя даже после изменений. Параллельно вышла Gemini 2.5 Flash Image, новая флагманская модель генерации изображений.
Гонка вооружений в мире ИИ только ускоряется. Microsoft, OpenAI и Google выдают новинки одна за другой, и скорость развития технологий становится всё более головокружительной.