OpenAI представила Sora 2 — нову версію ШІ для генерації відео та аудіо

OpenAI разом із соцмережею у стилі TikTok показала Sora 2 — оновлену модель для створення відео та аудіо, яка вміє генерувати фотореалістичні сцени та синтезувати мову.

Головна новація — функція Cameo, що дозволяє додавати у відео самого себе або інших людей. Для цього достатньо один раз записати відео й аудіо, щоб підтвердити особу.

За словами розробників, Sora 2 краще працює з фізикою рухів, ніж попередня версія. Якщо перша модель плуталася навіть у простих діях, як-от відскок баскетбольного м’яча від щита, то тепер із цим немає проблем. У прикладах OpenAI показала гімнастичні й скейтбордистські трюки, а також бойові мистецтва. Хоча подекуди алгоритм усе ще робить помилки, особливо зі складними об’єктами. Крім того, модель навчилася генерувати мову — зокрема й російською.

Перші користувачі відзначають, що Sora 2 чудово справляється з анімуванням мемів, перетворенням будь-яких роликів у стильні аніме-сцени, створенням таймлапсів і вставкою мультяшних персонажів у фільми. Для відео можна обирати горизонтальний або вертикальний формат, а їхня тривалість обмежена 10 секундами.

Деякі запити система блокує: наприклад, не можна створити ролик зі Шреком чи штурмовиком із «Зоряних війн». Водночас образ Пікачу використовувати дозволено. Sora 2 уже доступна в застосунку Sora для iOS, але поки що лише за запрошеннями.

Связанные записи

“Одіссей”: найбільший український безпілотник евакуює поранених з поля бою та перевозить зброю

iPhone 17 Air буде тоншим і легшим за iPhone 17 Pro, але матиме один мінус

Бюджетні смартфони, які вас здивують: топ-7 моделей, які варті уваги