OpenAI выпустила альфа-версию продвинутого голосового помощника

Поделиться

OpenAI-min

OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для небольшой группы пользователей ChatGPT Plus. Для всех владельцев подписки он станет доступен осенью.

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

— OpenAI (@OpenAI) July 30, 2024

Участники альфа-группы получат оповещение в приложении и электронное письмо с инструкцией по использованию нового режима. Пользователи могут общаться с ChatGPT голосом и получать ответы в реальном времени без задержек, а также перебивать искусственный интеллект во время его речи.

В мае OpenAI представила последнюю модель чат-бота GPT-4o и анонсировала добавление специального режима Voice Mode для общения голосом. Запуск альфа-версии планировался к концу июня, но его перенесли на месяц.

Некоторые продемонстрированные в мае возможности ИИ не вошли в запущенную альфа-версию, включая совместное использование экрана и поддержку видео. Они будут представлены позже.

Расширенный голосовой режим

Стандартный голосовой режим ChatGPT использует три отдельные модели:

  • одну для преобразования голоса в текст;
  • другую для обработки запроса;
  • третью для конвертации текста в голос.

Новое решение мультимодального GPT-4o отличается, поскольку не использует вспомогательные модели. Благодаря этому разговор ведется с меньшей задержкой. По словам OpenAI, чат-бот может улавливать эмоциональные интонации в голосе вроде грусти или волнения.

ChatGPT может общаться на четырех голосах, записанных в сотрудничестве с актерами озвучивания. Он не будет имитировать речь других людей. Дополнительно добавлены фильтры для отклонения некоторых запросов на создание музыки или других форм защищенного авторским правом контента.

Напомним, в июле OpenAI сообщила о тестировании новых функций поиска на базе ИИ — SearchGPT.

В том же месяце СМИ узнали о работе компании Сэма Альтмана над новой технологией Strawberry, которая «значительно улучшит процесс рассуждения ИИ-моделей и даст им возможность планировать действия наперед».

Это интересно

Похожие новости

Треть российских банков оказалась не готова работать с цифровым рублем

Результаты опроса, проведенного компаниями «Диасофт» и «Флант», поставщиками ИT-решений...

Анонс РОСА Мобайл 2.0: очень нужный апдейт российской ОС

НТЦ ИТ РОСА анонсировал вторую версию российской операционной системы...

Аргентина утвердила нормативные требования для провайдеров криптовалютных услуг

Национальная комиссия по ценным бумагам Аргентины (CNV) завершила разработку...

AirPods стануть вашим особистим перекладачем: iOS 19 додасть функцію перекладу в навушники

У навушниках AirPods невдовзі з’явиться можливість миттєвого перекладу живих...

Критична помилка Windows 11 блокує роботу програм на комп’ютерах з NVIDIA

Користувачі тестових збірок Windows 11 зіткнулися з критичною помилкою,...