Компания OpenAI запустила новую флагманскую ИИ-модель, которая будет лежать в основе следующего поколения ChatGPT.
GPT-5 is here.
Rolling out to everyone starting today.https://t.co/rOcZ8J2btI pic.twitter.com/dk6zLTe04s— OpenAI (@OpenAI) August 7, 2025
GPT-5 — первая «унифицированная» нейросеть, совмещающая режим последовательных рассуждений и быстрых ответов в стиле GPT. Специальный маршрутизатор определяет, какой подход выбрать для решения задачи: дать быстрый ответ или потратить больше времени на обдумывание, чтобы повысить качество результата.
GPT-4 позволял чат-боту давать ответы на широкий круг вопросов. GPT-5 уже способна выполнять задачи от имени пользователя вроде создания программных приложений, навигации по календарю или создания исследовательских отчетов.
CEO стартапа Сэм Альтман назвал GPT-5 «лучшей моделью в мире» и «значительным шагом» к созданию искусственного общего интеллекта, который может превзойти человека в наиболее экономически ценной работе.
GPT-5 могут использовать пользователи без платной подписки с определенными лимитами. Для владельцев Plus и Pro они увеличены.
По API доступно три модели: GPT-5, GPT-5 mini, GPT-5 nano.
Бенчмарки
OpenAI позиционирует GPT-5 как самую передовую в нескольких областях. По ряду показателей она опережает разработки Anthropic, Google DeepMind и xAI, но в некоторых направлениях уступает конкурентам.
Среди сильных сторон новой модели — программирование. В тесте SWE-bench Verified она набрала 74,9% с первой попытки, обойдя Claude Opus 4.1 (74,5%) и Gemini 2.5 Pro (59,6%).
В одном из примеров GPT-5 создала интерактивный материал для объяснения сложных концепций вроде эффекта Бернулли. Она сгенерировала сотни строк кода за пару минут.
demo time:
GPT-5 can make something interactive to explain complex concepts like the bernoulli effect to you, churning out hundreds of lines of code in a couple of minutes. pic.twitter.com/cIU7O608TT— Sam Altman (@sama) August 7, 2025
В другом модель создала веб-приложение для изучения французского языка.
В тесте Humanity’s Last Exam, оценивающем работу ИИ в математике, гуманитарных и естественных науках, GPT-5 с расширенным мышлением (GPT-5 Pro) набрала 42%. Показатель Grok 4 Heavy оказался выше — 44,4%.
Илон Маск воспользовался возможностью потроллить OpenAI.
Bottom line though:
Grok 4 Heavy was smarter 2 weeks ago than GPT5 is now and G4H is already a lot better.
Let that sink in. https://t.co/BrggsEwnuz— Elon Musk (@elonmusk) August 7, 2025
«Grok 4 Heavy был умнее две недели назад, чем GPT5 сейчас, а G4H уже намного лучше», — написал миллиардер.
В тесте GPQA Diamond, который состоит из научных вопросов уровня докторантуры, GPT-5 pro набрала 89,4% с первой попытки, превзойдя Claude Opus 4.1 (80,9%), и Grok 4 Heavy (88,9%).
OpenAI утверждает, что GPT-5 лучше справляется с вопросами, связанными со здоровьем. В HealthBench Hard Hallucinations, измеряющем точность модели по темам здравоохранения, GPT-5 галлюцинирует в 1,6% случаев. Это намного ниже, чем у предыдущих моделей GPT-4o и o3 — 12,9% и 15,8% соответственно.
Компания заявляет, что GPT-5 превосходит другие инструменты в более сложных для измерения субъективных областях вроде креативного дизайна и письма.
Новая модель в целом намного меньше галлюцинирует — в 4,8% случаев. Это значительно ниже o3 и GPT-4o, которые «выдумывают» неправдивую информацию в 22% и 20,6% ответах соответственно.
В Tau-bench, который измеряет способность ИИ выполнять симулированные онлайн-задачи, GPT-5 продемонстрировал неоднозначные результаты. В части теста, где нужно перемещаться по веб-сайту авиакомпании, модель набрала 63,5%. У o3 показатель 64,8%. В эпизоде с перемещением по страницам розничных продавцов показатель составил 81,1%, что ниже результата Claude Opus 4.1 — 82,4%.
OpenAI отметила, что новая нейросеть отличается повышенной безопасностью: она реже выдает ложные ответы и эффективнее выявляет злоумышленников.
Обновления
Вместе с релизом GPT-5 в ChatGPT появилась функция кастомизации, позволяющая настроить стиль общения чат-бота. Пользователи могут выбрать один из предложенных типов личности: циник, робот, слушатель и ботаник. Эти параметры автоматически влияют на формулировки ответов, исключая необходимость каждый раз задавать желаемый тон вручную.
Среди других обновлений:
- улучшенный голосовой режим — он стал более естественным и умным;
- возможность настройки цвета чатов;
- подключение сторонних сервисов вроде Gmail и Google Calendar для получения более качественных ответов.
Напомним, в августе OpenAI выпустила рассуждающие ИИ-модели с открытым исходным кодом. Они демонстрируют высокие показатели в ряде бенчмарков и доступны для загрузки на Hugging Face.