Другие новости

Опубликована 2 апреля, 16:29

Генератор картинок: нейросеть рисует изображения по тексту

Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.

Telegram-канал сервиса

Telegram-чат сервиса

Генератор изображений

Вам доступны четыре режима для картинок:

  • создать изображение
  • обработать
  • анализ изображения
  • улучшить запрос

Создать изображение

Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).

Доступны пять версий генерации изображений:

  • V1 — версия для анимационных и мультяшных изображений.
  • V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
  • V3 — фотореализм, портретные снимки людей и животных.
  • V4 — это объединение версий v1-v3. Для абстрактных изображений, животных, природы, арт объектов. Эта модель лучше распознает текстовый запрос и может рисовать картинки в разных стилях: как в реалистичном, так и в анимационном. Разрешение изображения по умолчанию 1024×1024.

v4 — ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.

  • V5 — модель для генерации постеров, логотипов, креативных изображений с текстом.

Параметры V5:

  • скорость генерации: 30-40 секунд
  • ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
  • данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
  • тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
  • можно подобрать надпись на русском, если использовать латинские буквы
  • модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
  • в V5 доступны такие размеры генерации картинок: 1280х720, 1232х768, 1024х1024, 1152х768, 1024х768, 720х1280, 768х1232, 768х1152, 768х1024
  • vаксимальный размер картинки увеличен с 1024 до 1280 пикселей (в 9:16 и 16:9)
  • соотношения сторон: 2:3, 3:4, 10:16, 9:16, 3:2, 4:3, 16:10, 9:10, 1:1
  • smart_off — если указать smart_prompt: off, то нейросеть не будет менять запрос пользователя (по умолчанию меняет). Использование параметра полезно, когда надо достигнуть большего реализма и соответствия результата запросу

По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2

Примеры запросов:

рыжий кот сидит на крыше; v_model: v1

красивая девушка стоит на берегу моря; v_model: v2

Примеры изображений

V5


A MiXit logo is smashed by the MiXit logo cosmetics, foam, 4k, remarkable, professional realistic photo, photography, cinematic, photo, typography; v_model: v5
Donald Trump standing behind a American flag holding a sign with text Hello; v_model: v5
the inscription «COH» on the wall; v_model: v5

Elon Musk stands in front of a huge rocket with a poster in his hands with the inscription «MACK»; v_model: v5
A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5
geometric, symmetry, triangle, pyramid, complex, tapestry, logo; v_model: v5
Smiling cat holding a sign with the inscription «KOT» in his hands; v_model: v5

Модели v1, v2, v3, v4

роскошные розовые пионы в вазе; v_model: v1
роскошные розовые пионы в вазе; v_model: v2
роскошные розовые пионы в вазе; v_model: v3
роскошные розовые пионы в вазе; v_model: v4
роскошные розовые пионы в вазе; v_model: v5
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v1
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v2
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v3
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v4
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v5

красивая молодая женщина, платиновые волосы, без макияжа, черно-белый полосатый свитер, в темно-красных наушниках; v_model: v3
портрет Майкла Джексона в образе повелителя скелетов; v_model: v3
волчица с белым окрасом смотрит в объектив камеры в капюшоне; v_model: v3
Померанский шпиц бежит по весеннему лесу и улыбается, весёлая атмосфера; style: anime, v_model: v3

огненная пчела, пламя вулканической лавы переливается по всему телу пчелы, невероятные яркие цвета, фантастический сюжет на заднем фоне; v_model: v4, style: cinematic
яблочный пирог; v_model: v3
Девушка с длинными кудрявыми рыжими волосами, веснушки на лице, натуральная кожа; height: 1024, width: 1024, v_model: v3

Анализ изображений

Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.

Примеры анализа изображений:

Запрос: Что ты знаешь про сервис, название которого указано на картинке? Опиши подробно информацию про эту компанию.

Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.

TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:

 Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.

 Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.

Запрос: Объясни на русском, в чём суть этого мема?

Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.

Запрос: Опиши подробно эту схему

Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.

На схеме показаны следующие компоненты:

Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.

 Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.

 Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.

 Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.

 Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.

 Насос: это устройство, которое перекачивает воду под давлением в реактор.

Возможности и ограничения

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

  • для генерации картинки нужно ввести от 1 до 60 слов (не менее 4 символов)
  • время генерации — от 10 до 20 секунд
  • размер изображения по умолчанию — 768х768
  • введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
  • изображение можно увеличить до 4096х4096
  • между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
  • при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
  • между текстовым запросом и параметрами ставится точка с запятой ;
  • бесплатный режим — 10 попыток
  • PRO-режим или Ultra (вместе с попытками в текстах) — по 100 попыток в каждом режиме (стоимость 150 и 270 ₽)
  • PRO image+ и PRO text+  — 720 попыток в PRO image+, 216 попыток в PRO text+ (стоимость 630 ₽ и 590 ₽)
  • ULTRA+ — Все возможности тарифа PRO_text+ и PRO_image+ (стоимость 1090 ₽)
  • VIP-тариф — 10000 попыток для генерации изображений + 3000 попыток для текстов (стоимость 6 000 ₽)

Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792

Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 попытки за одну генерацию!!!

Текстовые запросы и параметры

Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.

  • в моделях v4 и v5 пользователи бесплатного тарифа получают 2 варианта изображения по одному запросу; платные тарифы — 3 изображения.
  • команда /default_params —  в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
  • style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)

Пример использования параметра style:

  • seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
  • width – ширина изображения. По умолчанию 768, максимум 1024
  • height – высота изображения. По умолчанию 768, максимум 1024

рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768

  • steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
  • negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:

1 запрос

белый шпиц танцует, стоит на задних лапах

следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.

белый шпиц танцует, стоит на задних лапах, negative_prompt: пятая лапа, seed: 477457978, steps: 100

Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.

  • scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)
scale 1 — фото смажет
scale 5 — блеклое, естественное, как в пасмурную погоду
scale 10 — солнечное освещение, больше яркости
scale 20 — перенасыщенное фото
  • если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
  • каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:

Не правильно 👇

высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза

Правильно 👇

красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к

  • чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).
девушка с розовыми волосами, украшения с бриллиантами на шее, seed: 6926903312
девушка с розовыми волосами, (розовые волосы:1.5), украшения с бриллиантами на шее, seed: 6926903312
  • чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:
девушка с розовыми волосами, [розовые волосы:0.5], украшения с бриллиантами на шее, seed: 6926903312

Примеры использования параметров в текстовых запросах:

  • лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
  • морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
  • вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
  • Марго Робби в стиле мультфильма «Холодное сердце», ледяное тело, вся одежда во льду, scale: 20
  • милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
  • Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
  • животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
  • постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic

Стили

В модели V4

Стиль прописывается в текстовом запросе ДО параметров, до ;. Например: Портрет улыбающейся женщины с карими глазами и темными волосами, стиль Sand sculpture; v_model:v4

стиль Sand sculpture

стиль Bronze statue

стиль Roman mosaic

Еще больше стилей для V4

Другие стили

В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.

В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).

Стили и примеры генерации (доступны для моделей V1-V3):

Ralph McQuarrie — простые формы ретрофутуризм

Syd Mead — детальные как картины ретрофутуризм

Robert McCall — старый ретрофутуризм без деталей

Klaus Burgle — ч/б фото ретрофутуризм

Ron Cobb — стильные картины, баланс, формы

John Berkey — черезчур детальное, путается

Norman Rockwell — ретрофутуризм

Tristram James Ellis, Michelangelo — античное нежное

Albert Bierstadt — древности, ренессанс

Georges Desvallières — более современное, но все еще старинное

Peregrine Heathcote — упрощённые абстракции

Giovanni Battista Piazzetta — ренессанс

Valentin de Boulogne — ЛЮТЫЙ ренессанс

Ivan Aivazovsky — вода

Ivan Shishkin — деревья, небо

Asher Brown Durand — навроде Шишкина, растения

Maxfield Parrish — навроде Шишкина, нежное

Hans Thoma — детальные ландшафты вроде Шишкина

Thomas Kinkade — красивые пейзажи точками, нежные

Asher Brown Durand — футуризм ландшафты, хорошо сочетается с классикой

Gustave Dore  — ЧБ старинные детальные ландшафты вроде Шишкина

gonzalo fuenmayor — ЧБ окружения

Eddie Mendoza — футуризм

Ryan Dening — футуризм

Thomas Kinkad — красочный футуризм

Tyler Edlin — мрачный детальный футуризм

Blizzard Concept Artists — футуризм

Sparth Liang Mark G Liulian Craig Mullins, Finnian MacManus — красивые ландшафты/виды

James Gurney  — красиво, растения, динозавры

George Stubbs — красочные спокойные иллюстрации

Kawase Hasui — красочные спокойные ландшафты  

Jakub Różalski  — около-классические ландшафты

Anton Fadeev — красочные яркие ландшафты

Anato Finnstark — красочные яркие ландшафты

Ismail Inceoglu — красочные яркие ландшафты

Finnian MacManus — футуризм ландшафты окружения

Stefan Koidl  — около-сталенхаг

Simon Stalenhag  -—сталенхаг

Ludwig Deutsch and Rudolf Ernst — около-сталенхаг

Brock Hofer  — линии

Wes Anderson — линии

Denis Villeneuve — линии

Jean Giraud — красивые персонажи сглаженные и абстрактные

Tom Bagshaw — красивые персонажи сглаженные и абстрактные

Edward Hopper — красивые персонажи сглаженные и абстрактные

Rene Margitte — красивые персонажи сглаженные и абстрактные

artgerm — персонажи

Alexander Trufanov — персонажи

Andrei Riabovitchev — красивые персонажи

James Jean — красивые персонажи

Edward Robert Hughes, Henry Justice Ford — красивые персонажи

Rolf Armstrong, Monia Merlo — красивые персонажи

Kezie Demessance — красочные персонажи

Ha Gyung — красочные персонажи

Zac Retz — красочные персонажи

Peter Mohrbacher — красивые персонажи и ландшафты (MTG стиль)

Portrait painting by Arthur Rackham, Eugene de Blaas, Frederic Leighton 

  — иллюстрации

Naranbaatar Ganbold — детальная прорисовка ЧБ форм персонажей

Katsuya Terada — интересные чб абстрактные персонажи

Alexandros Pyromallis Intaglio — ЧБ персонажи

Marc Simonetti  — мрачные эпичные ландшафты

Jonathan Solter  -— эпичные ландшафты

Greg Rutkowski — мрачные персонажи-ландшафты

sidwill — мрачные персонажи

Dragan Bibin — мрачные персонажи

Frank Frazetta — мрачные персонажи

jacques callot  — чб гравюры детальные

Pieter Claesz  — чб гравюры книжные

Geof Darrow — цветные иллюстрации! с линиями

Hasui Kawase — традиционное японское

Zdzisław Beksiński — всякое стрёмное

Wayne Barlowe  — всякое стрёмное

Arthur Rackham  — всякое стрёмное

Dariusz Zawadzki — всякое стрёмное

Ute Osterwalder  — экспериментальные персонажи

Hajime Sorayama  — экспериментальные персонажи

Carlos Schwabe   — экспериментальные персонажи

Adolf Hirémy-Hirschl — экспериментальные персонажи

Carl Spitzweg  — крутые грубые мазки и свет

Ещё примеры картинок и запросов к ним

Зайчик в виде облачка; v_model: v1
Зайчик в виде облачка; v_model: v2

Зайчик в виде облачка; v_model: v3
Зайчик в виде облачка; v_model: v4
Зайчик в виде облачка; v_model: v5
Мерцающие светлячки освещают путь через причудливый лес высоких грибов и сверкающих ручьев; v_model: v3
животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо; v_model: v3
Котёнок в очках загорает на пляже, лазурный берег, максимальная детализация, реалистичный стиль; v_model: v3
Девушка на фоне большого города; style: realism, steps: 70, v_model: v3
Девушка на фоне большого города; style: realism, steps: 70, v_model: v4
реалистичный кролик, плавающий в тарелке овощного супа; v_model: v3
реалистичный кролик, плавающий в тарелке овощного супа; v_model: v4
завтрак из жареных яиц, кетчуп, ветчина; v_model: v3
A VIP logo is smashed by the Pepper logo red pepper,fire, 4k, remarkable; v_model: v5
A VIP logo is smashed by the Pepper logo red pepper,fire, 4k, remarkable; v_model: v4

Проверка текста нейросетями

Биржа копирайтинга