- Gemini — обновление для чат-бота Bard от Google, расширяющее возможности нейросети.
- ИИ-разработка техгиганта превосходит GPT-4 по производительности и точности.
Корпорация Google выпустила глобальное обновление для чат-бота Bard, которое призвано значительно расширить возможности нейросети. Апдейт получил название Gemini.
We believe in making AI helpful for everyone. That’s why we’re launching Gemini, our most capable model that’s inspired by the way people understand and interact with the world. #GeminiAI pic.twitter.com/gNG9ha9xMO
— Google (@Google) December 6, 2023
Что умеет Gemini
CEO Google DeepMind Демис Хассабис и исполнительный директор Alphabet Сундар Пичаи представили Gemini как «значительный шаг вперед в технологии чат-ботов». Они подчеркнули его «превосходные способности» к точным ответам и возможность рассуждать на человеческом уровне в определенных ситуациях.
Обновленная нейросеть получила расширенный функционал для помощи в написании кода и математических вычислений, а также научилась распознавать изображения, видео и аудио.
Gemini доступен в трех вариациях: Ultra, Pro и Nano. Такое разнообразие позволяет приспособить нейросеть к любому устройству для конкретных целей — от мобильных телефонов до центров обработки данных.
Внедрение инструмента пройдет в два этапа. Изначально Bard обновится до бесплатной версии Gemini Pro. В следующем году Google представит Bard Advanced, который предоставит пользователям доступ к улучшенной ИИ-модели Gemini Ultra стоимостью $20 в месяц.
Gemini Nano — специальная версия для мобильных устройств, которая сможет работать без подключения к интернету. Владельцы смартфона Pixel 9 Pro уже могут протестировать чат-бота.
Ранняя итерация Gemini Pro будет использовать для работы текстовые подсказки, но в ближайшие месяцы ее функционал расширят до мультимодальной поддержки, включая тексты, изображения и другие медиа-файлы.
С дебютом Bard Advanced в 2024 году, который станет «новым опытом, основанным на самой мощной модели Gemini», нейросеть получит способность к рассуждению и возможность взаимодействовать с различными типами информации.
Апдейт:
После публикации видео с возможностями Gemini некоторые разработчики Google и отраслевые эксперты заявили, что технология работает не так хорошо, как предполагалось. Один из сотрудников компании рассказал Bloomberg о «преувеличении» функциональности и производительности ИИ.
Исполнительный директор Google DeepMind Ориол Виньялс пояснил, что пользовательские подсказки и выходные данные в видео реальны, а сроки их генерации «урезали для краткости».
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP— Oriol Vinyals (@OriolVinyalsML) December 7, 2023
На фоне распространившегося в СМИ и соцсетях скандала акции Alphabet упали со $139 до $135 за несколько дней, согласно MarketWatch.
Проверка возможностей
Google давно намеревается создать конкурирующий с ChatGPT продукт. По этой причине тестирование Gemini компания проводила в сравнении с языковыми моделями от OpenAI.
Согласно заявлению разработчиков, даже стандартная версия нейросети превосходит GPT-3.5, выпущенную в ноябре 2022 года. В шести из восьми тестов версия Pro превзошла соперника, что делает его самым мощным бесплатным чат-ботом с искусственным интеллектом.
GPT-4 уже смогла оказать сопротивление, но все же Gemini обошел ее по нескольким показателям.
Gemini Ultra показал немного лучшие результаты, чем GPT-4, в тестах на распознавание объектов и ответах на вопросы. Технология Google также лидирует в математических рассуждениях и генерации кода Python.
Кроме того, Gemini прошла 30 из 32 тестов State-Of-The-Art, которые проверяют способность ИИ к глубокому обучению, обработке естественного языка и решению общих задач.
Руководитель Google DeepMind Демис Хассабис рассказал о новой ИИ-модели в июне. Уже тогда он заявил о превосходстве над ChatGPT.
Напомним, в феврале корпорация представила чат-бота Bard. Спустя полтора месяца фирма открыла доступ к инструменту ограниченному числу пользователей.
В сентябре корпорация анонсировала новые функции на базе искусственного интеллекта, которые ускорят создание контента для YouTube.
Ранее соучредитель Google DeepMind Мустафа Сулейман заявил, что следующий этап развития ИИ — интерактивные боты, которые могут выполнять задачи за человека.