Google представила TPU, які дозволяють скоротити розробку ШІ-моделей з місяців до тижнів

Зміст

Корпорація Google зробила значний крок уперед у сфері штучного інтелекту, представивши восьме покоління власних тензорних процесорних блоків (TPU) на події Cloud Next ’26. Ці інноваційні чипи, представлені у двох конфігураціях – TPU 8t для тренування передових моделей ШІ та TPU 8i для їхньої ефективної роботи, обіцяють революціонізувати обчислювальні можливості, значно прискорюючи розробку та розгортання складних ШІ-систем.

TPU 8t: Прискорення навчання моделей

Масштабованість та продуктивність

TPU 8t розроблено з акцентом на максимальну ефективність у великомасштабних, обчислювально-інтенсивних завданнях навчання штучного інтелекту. Згідно з заявами Google, цей чип забезпечує вищу обчислювальну пропускну здатність та розширені можливості горизонтального масштабування, що є критично важливим для роботи з провідними моделями ШІ. Компанія стверджує, що TPU 8t здатен скоротити час, необхідний для розробки провідних моделей штучного інтелекту, з кількох місяців до тижнів. Система демонструє майже триразове збільшення обчислювальної продуктивності на один pod порівняно з попереднім поколінням, підтримуючи до 9600 чипів та 2 петабайти спільної пам’яті з високою пропускною здатністю. Крім того, TPU 8t забезпечує 97% goodput, тобто корисного обчислювального часу, завдяки комплексному набору функцій надійності, доступності та експлуатаційної зручності (RAS).

TPU 8i: Оптимізація інференційних завдань

Ефективність та швидкість обробки запитів

TPU 8i, у свою чергу, спеціально розроблений для обробки завдань інференції, що охоплюють широкий спектр від звичайних запитів користувачів до складних взаємодій між ШІ-агентами. Цей чип вирізняється значно більшою пропускною здатністю пам’яті, що дозволяє йому ефективно справлятися зі складними, спільними та ітеративними завданнями, що виконуються багатьма спеціалізованими агентами. Google пояснює, що ці агенти часто “об’єднуються” у складні потоки для надання рішень та аналітичних даних для найскладніших завдань. Для досягнення цієї мети TPU 8i поєднує 288 ГБ високошвидкісної пам’яті з 384 МБ вбудованої SRAM, що втричі більше, ніж у попередньому поколінні, забезпечуючи повне збереження активного робочого набору моделі на кристалі та запобігаючи простою процесорів. Google також подвоїла кількість фізичних процесорів на сервері, використовуючи власні чипи Axion на базі ARM, а вся система була оптимізована для покращення продуктивності завдяки неоднорідній архітектурі пам’яті (NUMA).

“Ці два чипи призначені для забезпечення роботи наших суперкомп’ютерів, розроблених на замовлення, і можуть виконувати найрізноманітніші завдання – від навчання передових базових моделей і розробки агентів до обробки величезних обсягів інференційних обчислень. Протягом багатьох років TPU забезпечують роботу провідних базових моделей, зокрема Gemini. Ці TPU 8-го покоління разом забезпечать масштабність, ефективність та потужність для завдань навчання, обслуговування та агентних обчислень”, – йдеться в заяві компанії.

Економічна ефективність та енергоспоживання

Google заявляє, що впровадження цих інновацій призводить до 80% кращої продуктивності на долар порівняно з попереднім поколінням чипів, що дозволяє компаніям обслуговувати майже вдвічі більше клієнтів за тією ж ціною. Крім того, TPU 8t та TPU 8i забезпечують до двох разів кращу продуктивність на ват порівняно з попереднім поколінням – Ironwood. Ці досягнення підкреслюють прагнення Google до створення не лише потужних, але й економічно ефективних та енергозберігаючих рішень у сфері штучного інтелекту.

Подальші розробки та інтеграція

Представлення TPU 8-го покоління є частиною ширшої стратегії Google щодо посилення своїх позицій на ринку хмарних обчислень та штучного інтелекту. Ці нові чипи, ймовірно, будуть інтегровані в існуючі та майбутні продукти Google Cloud, надаючи клієнтам доступ до передових обчислювальних потужностей. Очікується, що це сприятиме подальшому розвитку ШІ-технологій та відкриє нові можливості для бізнесу та досліджень.

TPU 8t: оптимізовано для навчання моделей ШІ.
TPU 8i: призначено для ефективної інференції.
Зменшення часу розробки моделей ШІ.
Значне підвищення продуктивності та енергоефективності.

Ці нові розробки від Google свідчать про стрімкий прогрес у сфері апаратного забезпечення для штучного інтелекту, де TPU відіграють ключову роль у прискоренні наукових відкриттів та впровадженні інноваційних рішень.