- OpenAI разрабатывает систему автономных ассистентов с ИИ.
- Годовая выручка стартапа превысила $2 млрд.
- Google запустил усовершенствованную платную версию продукта Gemini Advanced.
Компания OpenAI разрабатывает систему автономных ассистентов с ИИ, способную взять на себя управление устройством пользователя для выполнения определенных задач. Об этом со ссылкой на осведомленные источники пишет The Information.
Инициатива является логичным переходом от чат-ботов с генеративным искусственным интеллектом вроде ChatGPT к агентам действий.
Первые предназначены для создания текстов, изображений, аудио и видео. Для того, чтобы заставить подобную модель выполнять действия в реальном мире разработчики должны объединить их с внешними приложениями, которые адаптируют выходные данные ИИ в программируемый исполняемый файл.
Согласно изданию, лежащая в основе большинства интеллектуальных помощников технология не так надежна, как то, что работает «под капотом» ChatGPT и Gemini от Google.
Использование большой языковой модели при создании виртуальных ассистентов расширит потенциал их автономных действий в сравнении с аналогами текущего поколения. В качестве примера в The Information привели ситуацию, когда пользователь просит систему скопировать данные с одной платформы на другую.
Журналисты утверждают, что таким же образом система ИИ с достаточными правами сможет выполнять любое действие за человека. Например, пролистывание, постукивание, щелчок, двойной щелчок, ввод текста и даже решение головоломок с капчей.
Риски системы
В издании отметили, что дальнейшее развитие технологии усилит проблемы конфиденциальности и безопасности.
Современные системы генеративного ИИ требуют подключения к сервисам облачных вычислений. Хотя некоторые функции можно запустить на ноутбуках и смартфонах, маловероятно, что агент действий с искусственным интеллектом сможет работать только на специализированном встроенном чипе.
В статье говорится, что автономная система ассистентов с ИИ не только откроет неограниченный доступ к приватной информации, но и будет представлять собой новую критическую киберугрозу с глобальными последствиями.
Динамика OpenAI
По данным Financial Times, OpenAI вошла в число самых быстрорастущих технологических компаний в истории. В списке — фирмы, сумевшие выйти на семизначное значение дохода за 12 месяцев в первые десять лет после основания. Ранее этого статуса удостоились Meta и Google.
Годовая выручка организации превысила $2 млрд. Через год этот показатель может увеличиться более чем вдвое, согласно источникам.
По словам основателя Сэма Альтмана, в ноябре 92% компаний из списка Fortune 500 использовали продукты OpenAI, а еженедельная аудитория ChatGPT составляла 100 млн пользователей.
Предприниматель заявил, что компания остается убыточной из-за существенных затрат на создание и эксплуатацию своих моделей. Ожидается, что расходы продолжат опережать рост выручки, что потребует привлечения еще десятков миллиардов долларов.
В 2023 году Microsoft заключила сделку с OpenAI, которую СМИ оценили в $10 млрд. Позже разработки проекта появились в продуктах техгиганта, включая GPT-4 в поисковике Bing.
Ок, Google?
8 февраля стало известно о ребрендинге Bard от Google — чат-бот переименовали в Gemini. Техгигант также запустил обновление Gemini Advanced.
Согласно блогу, премиум-версия позволяет лучше понимать контекст предыдущих запросов, вести более длительные и подробные беседы. Чат-бот способен стать персональным наставником, помогать с продвинутым программированием и проводить мозговые штурмы творческих проектов.
CEO Google Сундар Пичаи заявил, что лежащая в основе Gemini Advanced технология в итоге сможет перехитрить даже самых умных людей при решении многих сложных тем.
«Самая крупная модель Ultra 1.0 первой превзошла экспертов в MMLU (массовом многозадачном понимании языка), в котором используется комбинация из 57 предметов, включая математику, физику, историю, юриспруденцию, медицину и этику», — пояснил он.
Gemini Advanced доступен по новой подписке Google One AI Premium за $20 в месяц. Вскоре его интегрируют в сервисы Google вроде Gmail, Docs, Sheets и Slides.
8 февраля Google запустил новое app Gemini для Android и iOS в США. В дальнейшем оно появится в других странах.
Мобильная версия чат-бота способна создавать подписи к фотографиям, отвечать на вопросы о статьях, совершать звонки и управлять устройствами умного дома. Она позиционируется как диалоговый мультимодальный помощник с ИИ.
«Мы работаем с местными регуляторами на предмет соблюдения местных требований», — прокомментировал вице-президент и генеральный менеджер Google Assistant и Bard Сисси Сяо.
Напомним, в феврале CEO Apple Тим Кук намекнул на появление искусственного интеллекта в продуктах компании «позднее в этом году».
В сентябре Meta представила набор ИИ-инструментов в виде голосового помощника, нейросети с различными личностями, «умных очков» и генератора стикеров.