Разработчики научили Midjourney генерировать текст

Поделиться

Генерация изображений нейросетью: 5 работающих сервисов

Компания Midjourney анонсировала новую модель ИИ-инструмента для создания изображений, которая получила возможность генерировать осмысленный текст.

We're now alpha-testing our V6 models Midjourney. Just type /settings and click V6 or add —v 6 after your prompt. Image coherence and prompt understanding are greatly improved. You can draw text and dolphins and there's new upscalers too. Happy holidays everyone!

— Midjourney (@midjourney) December 21, 2023

Согласно сообщению в Discord-канале, Midjourney V6 позиционируется как «капитальный ремонт» и в разы превосходит предшественника, выпущенного в марте этого года.

«Более точное следование рекомендациями, а также длинные подсказки, улучшенная связность и знания модели», — описали новую версию нейросети разработчики.

Одним из наиболее важных компонентов V6 является возможность генерации осмысленного текста, а не набора символов, как это было раньше. Однако разработчики отметили, что это не самый центральный элемент модели.

Благодаря улучшениям Midjourney теперь может составить конкуренцию ведущим генеративным моделям вроде DALL-E 3 и Ideogram.

Сравнение генеративных ИИ-моделей. Данные: Decrypt.

Из-за новых возможностей шестая версия ИИ стала слегка медленней и дороже, но разработчики пообещали поработать над ее производительностью в будущем.

Midjourney V6, обученная с нуля на суперкластерах ИИ, также может похвастаться улучшенными модулями масштабирования в «тонком» и «творческом» режимах, повышающими разрешение изображения в два раза.

Альфа-версия нейросети поддерживает несколько новых аргументов, включая «-ar» для изменения разрешения, «-chaos» для выбора вариаций генерации изображений, «-stylize» для изменения творческого стиля (чем меньше значение, тем быстрее нейросеть выдаст результат, жертвуя детализацией).

«Вам придется заново научиться подсказывать», — предупредила команда проекта.

Другие функции вроде зума и панорамирования появятся во время релиза модели.

Пока поучаствовать в тестирования Midjourney V6 можно на Discord-сервере, отправляя желаемый запрос в чат.

«Команда проекта включила системы модерации и будет обеспечивать соблюдение стандартов нашего сообщества с повышенной строгостью. Не будьте придурками и не создавайте образы, которые провоцируют драму», — подчеркнули разработчики.

Пользователи уже начали делится полученными результатами.

Midjourney V6 …. We have TEXT!
It can be hit or miss but still learning how it works.
These 4 were all from one generation.
Maybe got lucky 🤷‍♂️
Prompt in image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489

— Orcton (@OrctonAI) December 21, 2023

Большинство отмечает высокую степень детализации у созданных изображений даже без апскейла.

Midjourney V6 is looking mighty tasty!
Huge increase in detail at the same resolution.
These are NOT final model images and are not upscaled.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC

— GifCo (@giffboake) December 20, 2023

Для демонстрации возможностей Midjourney один из пользователей попросил сгенерировать «92-летнего морщинистого злого старика в студийном свете».

Midjourney v1 until v6, same prompt"
white background, closeup portrait of a very old mean man, 92 years old, wrinkles, realistic skin, studio lighting,, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3

— Marco Nedermeijer (@MNedermeijer) December 21, 2023

Ранее Google представила глобальное обновление для чат-бота Bard, которое призвано расширить возможности нейросети. Апдейт получил название Gemini.

Напомним, в ноябре ИИ-стартап Anthropic анонсировал новую модель Claude 2.1 с увеличенным контекстным окном на 200 000 токенов, эквивалентным 500 страницам текста.

Это интересно

Похожие новости

Темний режим не береже заряд смартфона? Фахівці зруйнували головний міф про економію батареї

Один із найпоширеніших міфів про економію заряду смартфона спростували....

Samsung готовит беспроводные наушники для хейтеров TWS

Samsung рассматривает альтернативные варианты конструкции для будущих беспроводных наушников....

Alibaba превратила Quark в ИИ-помощника

Компания Alibaba переработала приложение Quark, сделав из него...

Дизайн iPhone 17 Pro Max утверждён? Шпионское фото заготовок с завода

В Сети не утихают спекуляции о дизайне будущих моделей...