Nvidia открыто заявила, что моделям искусственного интеллекта в целом не хватает "здравого смысла". Хотя это едва ли станет откровением для тех, кто следит за развитием технологий – любой разумный человек понимает, что клей не стоит добавлять в пиццу, но это не помешало ИИ-обзору Google предложить именно такой рецепт для "дополнительной липкости". Для решения этой проблемы Nvidia решила исправить ситуацию с помощью человеческих наставников.
В недавнем посте Nvidia рассказала, как команда её фабрики данных подходит к обучению генеративного ИИ знаниям о мире, которые люди воспринимают как данность. Группа состоит из аналитиков "различных специальностей, включая биоинженерию, бизнес и лингвистику", которые "работают над разработкой, анализом и компиляцией сотен тысяч единиц данных" в надежде научить модели ИИ Nvidia основам физического мира.
Cosmos Reason – модель искусственного интеллекта, которая должна возглавить эту инициативу. Компания поясняет:
Cosmos Reason уникальна по сравнению с предыдущими моделями визуального языка, так как разработана специально для ускорения развития физического ИИ в таких областях, как робототехника, беспилотные транспортные средства и умные пространства. Модель способна делать выводы и рассуждать в беспрецедентных сценариях, используя физический здравый смысл.
Амбициозные заявления требуют соответствующих решений, и Nvidia выбрала довольно приземлённый подход – серию тестов с вариантами ответов, похожих на школьные контрольные работы для ИИ.
Процесс начинается с того, что группа аннотаторов Nvidia создаёт пары вопросов и ответов на основе видеоданных. В качестве примера компания приводит ролик, где кто-то нарезает пасту. Человек-аннотатор спрашивает ИИ, какой рукой режут макароны. Искусственный интеллект должен выбрать правильный ответ из четырёх вариантов, включая "не использует руки".
Тестирование ИИ по принципу экзамена для студента с обратной связью и исправлением неверных ответов называется обучением с подкреплением. После множества раундов таких испытаний, а также тщательного контроля качества между руководителями команды фабрики данных и исследовательской группой Cosmos Reason, разработчики надеются, что знания о физическом мире закрепятся в модели.
Всё это направлено на создание ИИ-моделей, способных управлять физическими механизмами, например, в заводской среде. Исследователь Nvidia Инь Цуй комментирует:
Без базовых знаний о физическом мире робот может упасть или случайно что-то сломать, создавая опасность для окружающих людей и среды.
Глава Nvidia считает, что ИИ заставит нас работать ещё больше
Nvidia представила "суперкомпьютерный мозг" для гуманоидных роботов
Недостаток понимания физических законов регулярно проявляется на соревнованиях гуманоидных роботов, где механические создания демонстрируют неуклюжие манёвры. Учитывая, что широкое внедрение роботов в производство и строительство неизбежно, то разработка рассуждающих ИИ-моделей, способных надёжно взаимодействовать с физическим миром играет огромное значение.