Разработчики научили Midjourney генерировать текст

Поделиться

Генерация изображений нейросетью: 5 работающих сервисов

Компания Midjourney анонсировала новую модель ИИ-инструмента для создания изображений, которая получила возможность генерировать осмысленный текст.

We're now alpha-testing our V6 models Midjourney. Just type /settings and click V6 or add —v 6 after your prompt. Image coherence and prompt understanding are greatly improved. You can draw text and dolphins and there's new upscalers too. Happy holidays everyone!

— Midjourney (@midjourney) December 21, 2023

Согласно сообщению в Discord-канале, Midjourney V6 позиционируется как «капитальный ремонт» и в разы превосходит предшественника, выпущенного в марте этого года.

«Более точное следование рекомендациями, а также длинные подсказки, улучшенная связность и знания модели», — описали новую версию нейросети разработчики.

Одним из наиболее важных компонентов V6 является возможность генерации осмысленного текста, а не набора символов, как это было раньше. Однако разработчики отметили, что это не самый центральный элемент модели.

Благодаря улучшениям Midjourney теперь может составить конкуренцию ведущим генеративным моделям вроде DALL-E 3 и Ideogram.

Сравнение генеративных ИИ-моделей. Данные: Decrypt.

Из-за новых возможностей шестая версия ИИ стала слегка медленней и дороже, но разработчики пообещали поработать над ее производительностью в будущем.

Midjourney V6, обученная с нуля на суперкластерах ИИ, также может похвастаться улучшенными модулями масштабирования в «тонком» и «творческом» режимах, повышающими разрешение изображения в два раза.

Альфа-версия нейросети поддерживает несколько новых аргументов, включая «-ar» для изменения разрешения, «-chaos» для выбора вариаций генерации изображений, «-stylize» для изменения творческого стиля (чем меньше значение, тем быстрее нейросеть выдаст результат, жертвуя детализацией).

«Вам придется заново научиться подсказывать», — предупредила команда проекта.

Другие функции вроде зума и панорамирования появятся во время релиза модели.

Пока поучаствовать в тестирования Midjourney V6 можно на Discord-сервере, отправляя желаемый запрос в чат.

«Команда проекта включила системы модерации и будет обеспечивать соблюдение стандартов нашего сообщества с повышенной строгостью. Не будьте придурками и не создавайте образы, которые провоцируют драму», — подчеркнули разработчики.

Пользователи уже начали делится полученными результатами.

Midjourney V6 …. We have TEXT!
It can be hit or miss but still learning how it works.
These 4 were all from one generation.
Maybe got lucky 🤷‍♂️
Prompt in image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489

— Orcton (@OrctonAI) December 21, 2023

Большинство отмечает высокую степень детализации у созданных изображений даже без апскейла.

Midjourney V6 is looking mighty tasty!
Huge increase in detail at the same resolution.
These are NOT final model images and are not upscaled.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC

— GifCo (@giffboake) December 20, 2023

Для демонстрации возможностей Midjourney один из пользователей попросил сгенерировать «92-летнего морщинистого злого старика в студийном свете».

Midjourney v1 until v6, same prompt"
white background, closeup portrait of a very old mean man, 92 years old, wrinkles, realistic skin, studio lighting,, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3

— Marco Nedermeijer (@MNedermeijer) December 21, 2023

Ранее Google представила глобальное обновление для чат-бота Bard, которое призвано расширить возможности нейросети. Апдейт получил название Gemini.

Напомним, в ноябре ИИ-стартап Anthropic анонсировал новую модель Claude 2.1 с увеличенным контекстным окном на 200 000 токенов, эквивалентным 500 страницам текста.

Это интересно

Похожие новости