OpenAI представила Sora 2 — нову версію ШІ для генерації відео та аудіо

Поделиться

OpenAI разом із соцмережею у стилі TikTok показала Sora 2 — оновлену модель для створення відео та аудіо, яка вміє генерувати фотореалістичні сцени та синтезувати мову.

Головна новація — функція Cameo, що дозволяє додавати у відео самого себе або інших людей. Для цього достатньо один раз записати відео й аудіо, щоб підтвердити особу.

За словами розробників, Sora 2 краще працює з фізикою рухів, ніж попередня версія. Якщо перша модель плуталася навіть у простих діях, як-от відскок баскетбольного м’яча від щита, то тепер із цим немає проблем. У прикладах OpenAI показала гімнастичні й скейтбордистські трюки, а також бойові мистецтва. Хоча подекуди алгоритм усе ще робить помилки, особливо зі складними об’єктами. Крім того, модель навчилася генерувати мову — зокрема й російською.

Перші користувачі відзначають, що Sora 2 чудово справляється з анімуванням мемів, перетворенням будь-яких роликів у стильні аніме-сцени, створенням таймлапсів і вставкою мультяшних персонажів у фільми. Для відео можна обирати горизонтальний або вертикальний формат, а їхня тривалість обмежена 10 секундами.

Деякі запити система блокує: наприклад, не можна створити ролик зі Шреком чи штурмовиком із «Зоряних війн». Водночас образ Пікачу використовувати дозволено. Sora 2 уже доступна в застосунку Sora для iOS, але поки що лише за запрошеннями.

Это интересно

Похожие новости

Вопреки другим: Макконахи и Кейн клонируют голоса с помощью ИИ

Лауреаты премии «Оскар» Мэттью Макконахи и Майкл Кейн...

Он — робот? Люди перестали отличать ИИ-музыку от настоящей

97% слушателей не могут отличить песни искусственного интеллекта...

Roadster 400 – самый необычный скутер от Italjet

На прошедшей выставке EICMA был представлен скутер...

Модульный робот-трансформер D1: один четвероногий или два двуногих

Базирующаяся в Гонконге робототехническая компания...