Другие новости

Опубликована 2 апреля, 16:29

Генератор картинок: нейросеть рисует изображения по тексту

Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.

Полезные ссылки

@TurboText_bot — бот с искусственным интеллектом для замены фона и т.п.

Turbotext.ru/photo_ai — сайт с нейросетями для создания картинок и видео

Turbotext.pro — сайт для создания уникального текстового контента

TurboCheck — сервис проверки качества текстов нейросетями

Telegram-канал TurboText

Сообщество нейрохудожников и нейрописателей в Telegram

Генератор изображений

Вам доступны четыре режима для картинок:

  • создать изображение
  • обработать
  • анализ изображения
  • улучшить запрос

Создать изображение

Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).

Доступны пять версий генерации изображений:

  • V1 — версия для анимационных и мультяшных изображений.
  • V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
  • V3 — фотореализм, портретные снимки людей и животных.
  • V4 — для абстрактных изображений, животных, природы, арт объектов. Доступно только для PRO media и тарифов покруче для медиа) — объединяет в себе возможности V1-V3, но с ограничениями на 18+, генерацию детей, знаменитостей, насилие и нарушающие законы изображения. Владельцы VIP-аккаунта могут получить картинку в разрешении 1792х1024 или 1024х1792 (списывается 5 токенов за 1 изображение)

v4 — ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.

  • V5 — модель для генерации постеров, логотипов, креативных изображений с текстом (кроме 18+, насилия и нарушения законов). Доступные размеры: 1024х1024, 512х1536, 704х1408, 736х1312, 800х1280, 832х1248, 864х1152, 896х1120, 1120х896, 1248х832, 1280х800, 1312х736, 1408х704, 1536х512

Параметры V5:

  • скорость генерации: 30-40 секунд
  • ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
  • данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
  • тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
  • можно подобрать надпись на русском, если использовать латинские буквы
  • модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
  • в V5 доступны такие размеры генерации картинок: 1280х720, 1232х768, 1024х1024, 1152х768, 1024х768, 720х1280, 768х1232, 768х1152, 768х1024
  • максимальный размер картинки — 1536 пикселей
  • есть поддержка разных соотношений сторон (1:3, 1:2, 2:3, 3:4, 4:5, 9:16, 10:16)
  • smart_off — если указать smart_prompt: off, то нейросеть не будет менять запрос пользователя (по умолчанию меняет). Использование параметра полезно, когда надо достигнуть большего реализма и соответствия результата запросу

По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2

Примеры запросов:

рыжий кот сидит на крыше; v_model: v1

красивая девушка стоит на берегу моря; v_model: v2

Примеры изображений

V5

A MiXit logo is smashed by the MiXit logo cosmetics, foam, 4k, remarkable, professional realistic photo, photography, cinematic, photo, typography; v_model: v5
коробка детского питания с названием «TurboText kids» в красных и черных оттенках, на коробке изображена мама с дочкой, в стиле футуризма; style: realism, v5, height: 1280, width: 800
Donald Trump standing behind a American flag holding a sign with text Hello; v_model: v5
the inscription «COH» on the wall; v_model: v5
A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5
A Nike logo is smashed by the Adidas logo, 4k, remarkable; v_model: v5
бутылка сидра с названием «Таня»; style: realism, v5, height: 1280, width: 800
логотип с названием «СТОЛОВАЯ», на котором изображены блюда европейской кухни, яркие цвета; v5, style: realism
милый кот пьёт кофе за столом, уютная домашняя атмосфера, на заднем плане текст «Доброе утро TurboText»; v5

Модели v1, v2, v3, v4, v5

роскошные розовые пионы в вазе; v_model: v1
роскошные розовые пионы в вазе; v_model: v2
роскошные розовые пионы в вазе; v_model: v3
роскошные розовые пионы в вазе; v_model: v4
роскошные розовые пионы в вазе; v_model: v5
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v1
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v2
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: V3
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v4
ангел крупным планом, ночное небо, крылья, звезды, луна; v_model: v5
красивая молодая женщина, платиновые волосы, без макияжа, черно-белый полосатый свитер, в темно-красных наушниках; v_model: v3
портрет Майкла Джексона в образе повелителя скелетов; v_model: v3
волчица с белым окрасом смотрит в объектив камеры в капюшоне; v_model: v3
Померанский шпиц бежит по весеннему лесу и улыбается, весёлая атмосфера; style: anime, v_model: v3
огненная пчела, пламя вулканической лавы переливается по всему телу пчелы, невероятные яркие цвета, фантастический сюжет на заднем фоне; v_model: v4, style: cinematic
яблочный пирог; v_model: v3
Девушка с длинными кудрявыми рыжими волосами, веснушки на лице, натуральная кожа; height: 1024, width: 1024, v_model: v3

Анализ изображений

Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.

Примеры анализа изображений:

Запрос: Что ты знаешь про сервис, название которого указано на картинке? Опиши подробно информацию про эту компанию.

Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.

TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:

 Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.

 Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.

Запрос: Объясни на русском, в чём суть этого мема?

Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.

Запрос: Опиши подробно эту схему

Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.

На схеме показаны следующие компоненты:

Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.

 Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.

 Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.

 Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.

 Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.

 Насос: это устройство, которое перекачивает воду под давлением в реактор.

Возможности и ограничения

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

  • для генерации картинки нужно ввести от 1 до 60 слов (не менее 4 символов)
  • время генерации — от 10 до 20 секунд
  • размер изображения по умолчанию — 768х768
  • введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
  • изображение можно увеличить до 4096х4096
  • между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
  • при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
  • между текстовым запросом и параметрами ставится точка с запятой ;
  • бесплатный режим — 5 токенов в BASE.
  • бесплатный режим — 10 токенов в BASE на изображения.
  • PRO-режим или Ultra (вместе с токенам в текстах) — по 100 токенов в каждом режиме в PRO_media и по 50 токенов в каждом режиме PRO text (стоимость PRO text 150, PRO_media 160 и Ultra 270 ₽)
  • PRO_media+ и PRO text+  — 720 токенов в PRO_media+ , 300 токенов в PRO text+ (стоимость PRO text+ 530 ₽, Media+ 570 ₽)
  • ULTRA+ — Все возможности тарифа PRO_text+ и PRO_media+  (стоимость 1090 ₽)
  • VIP-тариф — 10000 токенов для генерации изображений + 5000 токенов для текстов (стоимость 5100 ₽)

Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792

Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 токена за одну генерацию!!!

Текстовые запросы и параметры

Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.

  • команда /default_params —  в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
  • style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)

Пример использования параметра style:

  • seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
  • width – ширина изображения. По умолчанию 768, максимум 1024
  • height – высота изображения. По умолчанию 768, максимум 1024

рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768

  • steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
  • negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:

1 запрос

белый шпиц танцует, стоит на задних лапах

следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.

белый шпиц танцует, стоит на задних лапах, negative_prompt: пятая лапа, seed: 477457978, steps: 100

Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.

  • scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)
scale 1 — фото смажет
scale 5 — блеклое, естественное, как в пасмурную погоду
scale 10 — солнечное освещение, больше яркости
scale 20 — перенасыщенное фото
  • если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
  • каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:

Не правильно 👇

высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза

Правильно 👇

красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к

  • чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).
девушка с розовыми волосами, украшения с бриллиантами на шее, seed: 6926903312
девушка с розовыми волосами, (розовые волосы:1.5), украшения с бриллиантами на шее, seed: 6926903312
  • чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:
девушка с розовыми волосами, [розовые волосы:0.5], украшения с бриллиантами на шее, seed: 6926903312

Примеры использования параметров в текстовых запросах:

  • лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
  • морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
  • вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
  • Марго Робби в стиле мультфильма «Холодное сердце», ледяное тело, вся одежда во льду, scale: 20
  • милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
  • Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
  • животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
  • постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic

Стили

В модели V4

Стиль прописывается в текстовом запросе ДО параметров, до ;. Например: Портрет улыбающейся женщины с карими глазами и темными волосами, стиль Sand sculpture; v_model:v4

стиль Sand sculpture

стиль Bronze statue

стиль Roman mosaic

Еще больше стилей для V4

Стили модели V2

Стили модели V3

Другие стили

В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.

В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).

Ещё примеры картинок и запросов к ним

Зайчик в виде облачка; v_model: v1
Зайчик в виде облачка; v_model: v2
Зайчик в виде облачка; v_model: v3
Зайчик в виде облачка; v_model: v4
Зайчик в виде облачка; v_model: v5
Мерцающие светлячки освещают путь через причудливый лес высоких грибов и сверкающих ручьев; v_model: v3
животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо; v_model: v3
Котёнок в очках загорает на пляже, лазурный берег, максимальная детализация, реалистичный стиль; v_model: v3
Девушка на фоне большого города; style: realism, steps: 70, v_model: v3
Девушка на фоне большого города; style: realism, steps: 70, v_model: v4
Девушка на фоне большого города; style: realism, steps: 70, v_model: v3
Девушка на фоне большого города; style: realism, steps: 70, v_model: v3
завтрак из жареных яиц, кетчуп, ветчина; v_model: v1
завтрак из жареных яиц, кетчуп, ветчина; v_model: v2
завтрак из жареных яиц, кетчуп, ветчина; v_model: v3
завтрак из жареных яиц, кетчуп, ветчина; v_model: v4
завтрак из жареных яиц, кетчуп, ветчина; v_model: v5

A VIP logo is smashed by the Pepper logo red pepper,fire, 4k, remarkable; v_model: v4
A VIP logo is smashed by the Pepper logo red pepper,fire, 4k, remarkable; v_model: v5

Проверка текста нейросетями

Биржа копирайтинга