
MediaTek Dimensity 9600 и Google TPU v7 Ironwood: как облачный ИИ учит смартфоны экономить энергию
Современный мобильный чип – это уже не просто маленький процессор для запуска приложений. В 2025 году флагманский SoC напоминает мини-датацентр в кармане: он одновременно тянет тяжёлые игры, 4K-видео, камеры с многокадровой обработкой и всё более прожорливые нейросети. На этом фоне сотрудничество Google и MediaTek вокруг TPU v7 Ironwood выглядит не просто интересным, а стратегическим. То, что Google отрабатывает на масштабных облачных ускорителях, постепенно перекочёвывает в потребительские чипы – и первым крупным бенефициаром должен стать Dimensity 9600.
Ironwood позиционируют как один из первых действительно жизнеспособных специализированных ускорителей (ASIC), способных на равных спорить с GPU поколения NVIDIA Blackwell в задачах ИИ. Но важно не только то, насколько он быстрый. Важнее, какую школу он даёт инженерам MediaTek: работу с жесткими ограничениями по энергопотреблению, пропускной способности памяти и архитектуре межсоединений. Всё это – именно те знания, которые критичны для смартфонов, где каждый милливатт и каждый градус температуры на счету.
Почему Google Ironwood TPU v7 так много обсуждают
На протяжении многих лет NVIDIA фактически монополизировала рынок ИИ-вычислений с помощью своих GPU и экосистемы CUDA. Они универсальны, гибки и отлично подходят для обучения больших моделей. TPU – другая философия: это специализированные ASIC, заточенные под конкретные типы математики и архитектуры моделей. За универсальность приходится платить – зато, если попасть точно в рабочий профиль, можно выиграть в энергоэффективности и стоимости.
Ironwood TPU v7 появляется именно в тот момент, когда индустрия резко смещается от гигантских экспериментальных моделей к более прагматичным решениям: оптимизированным моделям и сервисам, где на первом месте уже не обучение, а массовый продакшн-инференс. Здесь всё решает не максимальная производительность любой ценой, а соотношение цена/скорость/энергопотребление. По ранним оценкам, Ironwood близок к топовым GPU NVIDIA по скорости инференса, но выигрывает по совокупной стоимости владения: дешевле инфраструктура, ниже энергозатраты, проще масштабирование.
Чем дешевле и эффективнее Google запускает ИИ в облаке, тем агрессивнее он может продвигать такие сервисы и тем сильнее давление на всю экосистему. И в этой картине MediaTek интересна не только как подрядчик для Ironwood, но и как проводник этих подходов в мир смартфонов.
Архитектура Ironwood: от чиплетов до суперподов
В основе TPU v7 Ironwood лежит двухчиплетный модуль, который внешне воспринимается как единый ускоритель. Каждый чиплет включает несколько ключевых блоков, специализирующихся на разных видах ИИ-вычислений:
- TensorCore с систолической матрицей. Этот блок отвечает за плотные матричные умножения – фундаментальную операцию для большинства современных нейросетей. За счёт систолической архитектуры данные «прокачиваются» через массив вычислителей потоком, что резко снижает количество обращений к HBM и позволяет выжимать максимум из пропускной способности памяти.
- Vector Processing Unit (VPU). Нейросети – это не только матрицы, но и огромное количество покомпонентных операций: функции активации, нормализации, клиппинг и т. д. VPU оптимизирован именно под такие векторные задачи, разгружая остальные блоки.
- Matrix Multiply Unit (MXU). Дополняет TensorCore там, где требуются другие форматы данных, особые режимы умножения или более гибкая организация потока вычислений. В связке они дают архитектуре баланс гибкости и эффективности.
- Два SparseCore на чиплет. Это специализированные блоки для работы с разреженными структурами и нерегулярными доступами к памяти. Они особенно полезны при работе с эмбеддингами – большими словарями и категориальными признаками, которые нужно свернуть в компактные векторные представления. Такая математика лежит в основе рекомендательных систем, поиска и многих языковых моделей.
- 96 ГБ HBM. Большой объём высокоскоростной памяти позволяет держать внутри ускорителя крупные модели и объёмные эмбеддинги, минимизируя обращения к более медленной системной памяти и сети.
Ключевая часть истории Ironwood – межсоединения. Два чиплета внутри одного модуля связаны скоростным die-to-die (D2D) интерфейсом, который примерно в шесть раз быстрее типичного однонаправленного межчипового линка ICI. На уровне стойки 64 таких чипа объединены в единый кластер через ICI, обеспечивая каждому около 1,2 ТБ/с двунаправленной пропускной способности. Такой 64-чиповый модуль Google называет кубом.
Дальше в дело вступает оптический коммутатор OCS: он связывает множество кубов в огромный суперпод. Полноценный суперпод Ironwood насчитывает 144 куба и 9 216 чипов – фактически целый «город» из матричных и векторных блоков, SparseCore и HBM, спаянных в единую вычислительную ткань. На такой инфраструктуре Google обучает и обслуживает самые ресурсоёмкие модели, а MediaTek буквально видит изнутри, как устроена работа такого монстра.
Какую роль играет MediaTek в проекте Ironwood
Раньше Google плотно работал с Broadcom, совместно проектируя поколения TPU. В случае Ironwood часть ответственности сместилась: по сообщениям инсайдов, именно MediaTek поручили разработку модулей ввода-вывода (I/O). Это та самая логика, которая обеспечивает обмен данными между ускорителем, памятью и внешними устройствами.
На слайдах презентаций про этот блок обычно говорят мало, но в реальности от него зависит очень много. Любая лишняя задержка на I/O превращается в «пузырь» в конвейере вычислений, а любой переразмеренный буфер – в лишние милливатты утечки. UBS оценивает потенциальный финансовый эффект сотрудничества для MediaTek примерно в 4 млрд долларов, но деньги здесь не главное. Гораздо ценнее практический опыт: участие в проектировании одного из самых сложных ИИ-ускорителей в индустрии и возможность обкатать свои инженерные решения на масштабе Google.
От облачного ASIC к Dimensity 9600: что можно перенести
Важно понимать: TPU и мобильный процессор – это два разных мира. Ironwood – крупный специализированный ASIC под конкретный класc задач в стойке датацентра. Dimensity 9600 – универсальный мобильный SoC, который должен уметь всё подряд: от модема и обработки фото до игр и интерфейса. Перенести железо «один к одному» невозможно.
Но отлично переносится опыт. Работая над I/O Ironwood, инженеры MediaTek глубже понимают, как двигать данные быстро и при этом экономно, где жёстко отрубать питание, а где — тонко играть напряжением и частотой. Эти идеи вполне можно применить в Dimensity 9600. Прежде всего в трёх направлениях:
- Более агрессивный power gating. Чем точнее можно отключать неиспользуемые блоки – контроллеры, интерфейсы, кэш, внутренние шины, – тем меньше фонового потребления. Опыт Ironwood позволяет медиатековцам смелее делить логику на домены питания и отрабатывать сценарии быстрого пробуждения без ощутимых лагов для пользователя.
- Тонкая настройка напряжения (DVFS). В датацентре каждый ватт на тысячи чипов превращается в мегаватты, поэтому там очень внимательно относятся к динамическому изменению напряжения и частоты. Те же подходы можно масштабировать вниз: Dimensity 9600 сможет точнее подбирать напряжение под реальную нагрузку, а не работать с запасом «на всякий случай».
- Улучшенное тактирование и clock gating. Понимая реальные пути данных и характер типичных нагрузок, MediaTek может агрессивнее глушить тактовые домены в моменты простоя или снижать частоту отдельных блоков, если им не нужна пиковая производительность. Это напрямую влияет на нагрев и автономность.
Всё это особенно критично, если вспомнить, что в недавних флагманских архитектурах MediaTek почти отказалась от традиционных сверхэкономичных ядер. То есть теперь экономить нужно не за счёт «маленьких» ядер, а за счёт умной энергетики на уровне всей системы: планировщика, подсистемы памяти, межсоединений и ИИ-ускорителя. И здесь опыт Ironwood, где каждый ватт умножается на тысячи чипов, оказывается очень ценным.
Шире смартфона: AI-амбиции MediaTek
По утечкам и заявлениям топ-менеджеров ясно, что MediaTek не собирается ограничиваться только мобильными SoC. Компания уже работает над собственными ИИ-чипами для других сегментов: от пограничных (edge) устройств и умного дома до автомобильных систем и специализированных коробочных решений. В этих направлениях влияние TPU-опыта будет ещё прямее: можно использовать похожие систолические массивы, богатую поддержку разреженности, учитывать хитрые паттерны доступа к памяти в эмбеддингах.
Тем не менее именно Dimensity 9600 станет самым заметным витринным продуктом. Это флагман, который попадёт в топовые Android-смартфоны и где любой просчёт по теплу или автономности мгновенно накажут пользователи и блогеры. Поэтому нет сомнений, что MediaTek будет громко акцентировать не только «сухие» TOPS ИИ, но и более приземлённые эффекты: более длинную съёмку без перегрева, быстрое локальное улучшение фото и видео, голосовых ассистентов, устойчиво работающих офлайн, и генеративные функции, которые не высасывают батарею за считанные минуты.
Что это даёт пользователям и рынку
Обычный пользователь, конечно, не будет читать спецификации TPU и обсуждать D2D или OCS. Но эффект он почувствует довольно быстро. Более эффективный Dimensity 9600 – это смартфоны, которые меньше греются в играх, быстрее обрабатывают кадры с камеры, устойчивее держат производительность под длинной нагрузкой и при этом живут дольше от одного заряда.
Для индустрии связка Google – MediaTek означает ещё одно важное изменение: ускоряется уход от модели «один GPU на все случаи жизни» в сторону более узко специализированных ИИ-чипов и вертикально интегрированных стеков. NVIDIA Blackwell по-прежнему останется мощнейшим инструментом для обучения, но в инференсе и в мобильном сегменте у специализированных решений вроде Ironwood и чипов, вдохновлённых его архитектурой, всё больше шансов откусить значимую долю рынка. Для MediaTek это шанс укрепиться в верхнем сегменте и навязать более жёсткую конкуренцию Qualcomm.
Перспективы Dimensity 9600: между ожиданиями и реальностью
До релиза первых смартфонов на Dimensity 9600 и независимых тестов говорить можно только о направлениях и потенциале. Однако вектор достаточно прозрачен. Участвуя в проекте Ironwood, MediaTek получила место за столом, где обсуждаются самые сложные ИИ-архитектуры на планете. Всё – от жесткого бюджетирования энергии на уровне суперпода до тонкостей синхронизации огромного числа чипов – формирует инженерное мышление, которое затем переносится в мобильные решения.
Если компании удастся правильно упаковать этот опыт в Dimensity 9600 и последующие поколения, мы вполне можем увидеть новую волну Android-флагманов, которые не только «умнее» за счёт ИИ, но и банально приятнее в повседневном использовании: быстрее откликаются, меньше троттлят, реже просят зарядку и при этом выполняют всё больше задач прямо на устройстве, не гоняя трафик в облако. Путь от суперпода Google до вашего смартфона на самом деле куда короче, чем кажется на первый взгляд.
1 коммент
Ну ок, вы там экономьте ватты, а операторы всё равно добьют всё прошивкой и мусорными сервисами 🤦