Ученый назвал физическое мышление главным препятствием для ИИ 

Поделиться

робот под водой, как он исследует подводный морской мир AI seabed

Искусственный интеллект пока не способен в полной мере понимать физический мир. На сегодняшний день это главная проблема технологии, заявил профессор компьютерных наук Стэнфордского университета Фэй-Фэй Ли.

«Ведущие ИИ-технологии вроде больших языковых моделей (LLM) изменили способ получения нами доступа к абстрактным знаниям и работы с ними. Тем не менее они остаются мастерами лишь на словах: красноречивыми, но неопытными, знающими, однако необоснованными», — считает он.

По мнению ученого, появление «пространственного интеллекта» изменит то, как люди «создают и взаимодействуют с реальными и виртуальными мирами, совершив революцию в литературе, искусстве, робототехнике, науке и не только».

Создание такой технологии требует обучения моделей не только на «языке», но и на физических свойствах мира.

Ли утверждает, что искусственный интеллект быстро приближается к пределам возможностей текстового обучения, и в конечном итоге его прогресс будет зависеть от «моделей мира» — нового типа генеративного ИИ, который должен решать принципиально иной набор задач, чем LLM.

AI’s next frontier is Spatial Intelligence, a technology that will turn seeing into reasoning, perception into action, and imagination into creation. But what is it? Why does it matter? How do we build it? And how can we use it?
Today, I want to share with you my thoughts on… pic.twitter.com/L0bnJcCUqc

— Fei-Fei Li (@drfeifei) November 10, 2025

«Такие системы должны генерировать пространственно согласованные миры, подчиняющиеся физическим законам, обрабатывать многомодальные входные данные — от изображений до действий — и предсказывать развитие этих миров», — объяснил Ли.

Согласно видению профессора, пространственный интеллект представляет собой «границу за пределами языка — способность создавать взаимосвязь».

Идея «моделей мира»

Концепция появилась в начале 1940-х в ходе исследований шотландского философа и психолога Кеннета Крейка в области когнитивной науки.

Идея вновь возникла в современном ИИ-пространстве в 2018 году после статьи Дэвида Ха и Юргена Шмидхубера о том, что нейросеть может обучиться и воссоздать компактную внутреннюю модель окружающей среды и использовать ее в качестве симулятора для планирования и управления.

Однако решение задачи требует создания сложных систем, способных хранить пространственную память и моделировать сцены в более чем двух измерениях.

В сентябре компания Ли, World Labs, выпустила бета-версию Marble — ранней «модели мира», которая создавала интерактивные трехмерные среды с помощью текстовых или графических подсказок.

Пользователи могли перемещаться по сгенерированным средам без ограничений по времени или подгрузки сцен, а окружающая среда оставалась единой, не менялась и не распадалась.

Пример работы Marble. Источник: World Labs.

«Следующим рубежом развития ИИ станет пространственный интеллект — технология, которая превратит видение в рассуждение, восприятие в действие, а воображение в творчество», — сказал Ли, назвав Marble лишь первым этапом.

Напомним, в октябре Nvidia представила систему для подключения квантовых компьютеров к ИИ-чипам компании. Технология значительно ускорит обработку данных и откроет новые возможности для исследований в медицине и материаловедении.

Это интересно

Похожие новости