Энергопотребление графических процессоров для искусственного интеллекта неуклонно растет в последние годы и продолжит увеличиваться по мере того, как чипы для ИИ будут включать больше вычислительных модулей и чиплетов HBM-памяти.
Источники в индустрии указывают, что Nvidia уже рассматривает термический пакет мощности (TDP) от 6000 до 9000 Вт для своих графических процессоров следующего поколения. Однако эксперты из KAIST, ведущего корейского исследовательского института, полагают, что TDP процессоров для ИИ увеличится до невероятных 15360 Вт в течение следующих 10 лет, что потребует экстремальных методов охлаждения, включая иммерсионное и даже встроенное охлаждение.
От воздушного к иммерсионному охлаждению

До недавнего времени высокопроизводительных систем воздушного охлаждения с медными радиаторами и вентиляторами высокого давления было достаточно для охлаждения процессоров Nvidia H100. Однако когда чип Blackwell увеличил тепловыделение до 1200 Вт, а затем Blackwell Ultra повысил TDP до 1400 Вт, системы жидкостного охлаждения стали практически обязательными.
Ситуация станет еще более "горячей" с архитектурой Rubin, которая увеличит TDP до 1800 Вт, и с Rubin Ultra, которая удвоит количество GPU-чиплетов и HBM-модулей, а TDP возрастет до 3600 Вт. Исследователи из KAIST также считают, что NVIDIA и ее партнеры будут использовать жидкостное охлаждение прямо на чип (D2C) для Rubin Ultra, но для Feynman потребуется что-то еще более мощное.
График роста энергопотребления
Согласно прогнозам KAIST и индустриальных источников, тепловыделение процессоров для ИИ будет расти следующим так:
-
Blackwell Ultra (2025): 1400 Вт — D2C охлаждение
-
Rubin (2026): 1800 Вт — D2C охлаждение
-
Rubin Ultra (2027): 3600 Вт — D2C охлаждение
-
Feynman (2028): 4400 Вт — иммерсионное охлаждение
-
Feynman Ultra (2029): 6000 Вт — иммерсионное охлаждение
-
Post-Feynman (2030): 5920 Вт — иммерсионное охлаждение
-
Post-Feynman Ultra (2031): 9000 Вт — иммерсионное охлаждение
-
Поколение 2032 года: 15360 Вт — встроенное охлаждение
Новые технологии охлаждения

Исследователи из KAIST прогнозируют, что GPU-модули для ИИ (в частности, Nvidia Feynman) будут рассеивать 4400 Вт, тогда как другие источники считают, что Feynman Ultra увеличит TDP до 6000 Вт. Такие экстремальные тепловые характеристики потребуют использования иммерсионного охлаждения, при котором целые GPU-HBM модули погружаются в термическую жидкость.
Кроме того, ожидается, что такие процессоры и их HBM-модули будут оснащены термическими переходными отверстиями (TTV) – вертикальными каналами в кремниевой подложке, предназначенными для отвода тепла. Они будут сочетаться с термическими связующими слоями и датчиками температуры, встроенными в базовый кристалл HBM-модуля для мониторинга температуры в реальном времени и контроля обратной связи.
Иммерсионного охлаждения, как ожидается, будет достаточно до 2032 года, когда архитектуры GPU после Feynman увеличат TDP на блок до 5920 Вт или даже до 9000 Вт.

Тут все же стоит отметить, что основными потребителями энергии в GPU-модуле являются вычислительные чиплеты. Однако по мере увеличения количества стеков HBM до 16 после поколения Feynman и повышения энергопотребления на стек до 120 Вт с HBM6, энергопотребление памяти составит около 2000 Вт, или примерно 1/3 всего пакета.
Исследователи из KAIST предполагают, что к 2035 году энергопотребление графических процессоров для ИИ увеличится примерно до 15360 Вт, что потребует встроенных охлаждающих структур как для вычислительных блоков, так и для памяти. Эксперты указывают на две ключевые инновации – линии термической передачи (TTL), которые латерально перемещают тепло от горячих точек к охлаждающим интерфейсам, и жидкостные TSV (F-TSV), которые позволяют охлаждающей жидкости вертикально проходить через стек HBM.
К 2038 году полностью интегрированные тепловые решения станут еще более распространенными и продвинутыми, развивая эпоху "экзотических" методов охлаждения.