Amazon Web Services (AWS) пережила крупный сбой, из-за которого рухнула половина интернета — перестали работать Roblox, Fortnite, Snapchat, Slack и даже некоторые банковские сервисы. Масштаб произошедшего вновь показал, насколько весь цифровой мир зависит от облачных серверов Amazon и насколько уязвима эта инфраструктура.

Проблемы начались поздно вечером и затронули регион US-EAST-1 — один из ключевых центров обработки данных AWS, расположенный в Северной Вирджинии. Именно там фиксировались «значительные ошибки» в работе DynamoDB — распределённой базы данных, на которой держится огромное количество интернет-сервисов. Из-за этого миллионы пользователей по всему миру столкнулись с массовыми сбоями.
Сайт Downdetector сразу же зафиксировал лавину жалоб: Roblox не запускался, Fortnite не пускал в игру, Snapchat перестал отправлять сообщения, а Slack превратился в «черепаху» — корпоративные чаты просто зависали. Даже казалось бы независимые приложения, вроде популярной головоломки Wordle, начали выдавать ошибки при входе, а некоторые онлайн-банки временно перестали работать.
Разработчик Fortnite — компания Epic Games — быстро подтвердила проблемы. «Сбой, затронувший несколько интернет-сервисов, влияет и на авторизацию в Fortnite. Мы уже разбираемся и сообщим детали позже», — говорится в официальном заявлении.
По данным Amazon, причиной стала ошибка DNS-разрешения для API-эндпоинта DynamoDB в регионе US-EAST-1. «Мы ведём работу по нескольким направлениям, чтобы ускорить восстановление», — сообщили представители AWS. Они также отметили, что проблемы затронули и другие службы, включая IAM-обновления и глобальные таблицы DynamoDB. Пользователям рекомендовали повторять неудачные запросы, пока инженеры применяют меры по устранению неполадок.
Ближе к утру компания заявила, что «начальные меры» принесли первые результаты и система постепенно восстанавливается, хотя наблюдаются задержки и перегрузка запросов. «Некоторые сервисы уже работают, но полное восстановление может занять время», — уточнили в AWS.
Этот инцидент вновь поднял вопрос о хрупкости централизованных облачных решений. Когда одна из крупнейших инфраструктур мира даёт сбой, последствия ощущаются повсюду — от геймеров до банковских клиентов. Похоже, теперь многим компаниям придётся серьёзнее задуматься о резервных системах и диверсификации своих облачных сервисов.