Google представила Ironwood — тензорный процессор (TPU) седьмого поколения. Это специализированный ИИ-ускоритель, нацеленный на инференс — процесс вывода в предварительно обученных ИИ-моделях, который часто выполняется в реальном времени.
Утверждается, что Ironwood в два раза мощнее на ватт по сравнению c TPU компании Google шестого поколения, известным как Trillium.
Производительность одного чипа Ironwood достигает 4,6 Пфлопс. Каждый чип Ironwood оснащён 192 Гбайт HBM3 с пропускной способностью 7,2 Гбит/с.
Ironwood могут объединяться в кластеры из 9216 чипов, что позволяет получить производительность 42,5 Эфлопс, что в 24 раза превышает показатель самого мощного суперкомпьютера El Capitan.
Выпуск специализированного ускорителя для инференса Google объясняет изменением потребностей рынка. Практическое использование уже обученных моделей ИИ становится всё более распространённой задачей.
В ближайшее время компания планирует сделать Ironwood фундаментом для работы своих передовых моделей ИИ, включая Gemini 2.5.
Также Ironwood будет доступен клиентам облачных сервисов Google к концу 2025 года. Сторонние разработчики смогут использовать ускорители в двух конфигурациях: сервер с 256 чипами или кластер с 9216 чипами.
Попутно Google представила модель Gemini 2.5 Flash, ориентированную на эффективность и производительность. Она автоматически корректирует время обработки запроса на основе его сложности, что позволяет быстро отвечать на простые запросы.
По информации
https://mail.google.com/mail/u/0/#inbox/FMfcgzQZTzgqqTXqdMTcngTqXSpHJcxJ
Обозрение "Terra & Comp".