Генератор картинок: нейросеть рисует изображения по тексту

Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.

Сгенерировать в боте

Сгенерировать на сайте

Полезные ссылки

@TurboText_bot — бот с искусственным интеллектом для замены фона и т.п.

Turbotext.ru/photo_ai — сайт с нейросетями для создания картинок и видео

Turbotext.pro — сайт для создания уникального текстового контента

TurboCheck — сервис проверки качества текстов нейросетями

Telegram-канал TurboText

Сообщество нейрохудожников и нейрописателей в Telegram

Генератор изображений

Вам доступны четыре режима для картинок:

создать изображение
обработать
анализ изображения
улучшить запрос

Создать изображение

Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).

Доступны пять версий генерации изображений:

V1 — версия для анимационных и мультяшных изображений.
V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
V3 — фотореализм, портретные снимки людей и животных.
V4 — для абстрактных изображений, животных, природы, арт объектов. Доступно только для PRO media и тарифов покруче для медиа) — объединяет в себе возможности V1-V3, но с ограничениями на 18+, генерацию детей, знаменитостей, насилие и нарушающие законы изображения. Владельцы VIP-аккаунта могут получить картинку в разрешении 1792х1024 или 1024х1792 (списывается 5 токенов за 1 изображение)

v4 — ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.

Владельцы VIP-аккаунтов смогут генерировать изображения размером 1024х1792 и 1792х1024 в v4

V5 — модель для генерации постеров, логотипов, креативных изображений с текстом (кроме 18+, насилия и нарушения законов).

Параметры V5:

скорость генерации: 30-40 секунд
ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
можно подобрать надпись на русском, если использовать латинские буквы
модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
максимальный размер картинки — 1536 пикселей
есть поддержка разных соотношений сторон (1:3, 1:2, 2:3, 3:4, 4:5, 9:16, 10:16)
smart_off — если указать smart_prompt: off, то нейросеть не будет менять запрос пользователя (по умолчанию меняет). Использование параметра полезно, когда надо достигнуть большего реализма и соответствия результата запросу.
color (работает только в V5) — укажи параметр, чтобы задать градиент цветов на вашем изображении. Доступно 16 вариантов, указанные на изображении ниже

Пример запроса с параметрами:

Векторная рождественская иллюстрация антропоморфного кота в рождественской шапке и солнцезащитных очках, красного шарфа, модной одежды; style: cinematic, color: spring, num: 5

Примеры изображений

A MiXit logo is smashed by the MiXit logo cosmetics, foam, 4k, remarkable, professional realistic photo, photography, cinematic, photo, typography

коробка детского питания с названием «TurboText kids» в красных и черных оттенках, на коробке изображена мама с дочкой, в стиле футуризма; style: realism

Donald Trump standing behind a American flag holding a sign with text Hello

A Nike logo is smashed by the Adidas logo, 4k, remarkable

бутылка сидра с названием «Таня»; style: realism

логотип с названием «СТОЛОВАЯ», на котором изображены блюда европейской кухни, яркие цвета; style: realism

милый кот пьёт кофе за столом, уютная домашняя атмосфера, на заднем плане текст «Доброе утро TurboText»

Модели v1, v2, v3, v4, v5

V1 — ангел крупным планом, ночное небо, крылья, звезды, луна

V2 — ангел крупным планом, ночное небо, крылья, звезды, луна

V3 — ангел крупным планом, ночное небо, крылья, звезды, луна

V4 — ангел крупным планом, ночное небо, крылья, звезды, луна

V5 — ангел крупным планом, ночное небо, крылья, звезды, луна

V3 — красивая молодая женщина, платиновые волосы, без макияжа, черно-белый полосатый свитер, в темно-красных наушниках

V3 — портрет Майкла Джексона в образе повелителя скелетов

V3 — волчица с белым окрасом смотрит в объектив камеры в капюшоне

V3 — Померанский шпиц бежит по весеннему лесу и улыбается, весёлая атмосфера; style: anime

V4 — огненная пчела, пламя вулканической лавы переливается по всему телу пчелы, невероятные яркие цвета, фантастический сюжет на заднем фоне; style: cinematic

V3 — Девушка с длинными кудрявыми рыжими волосами, веснушки на лице, натуральная кожа; height: 1024, width: 1024

Анализ изображений

Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.

Примеры анализа изображений:

**Запрос**: Что ты знаешь про сервис, название которого указано на картинке? Опиши подробно информацию про эту компанию.

Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.

TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:

Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.

Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.

**Запрос**: Объясни на русском, в чём суть этого мема?

Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.

Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.

На схеме показаны следующие компоненты:

Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.

Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.

Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.

Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.

Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.

Насос: это устройство, которое перекачивает воду под давлением в реактор.

Возможности и ограничения

Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.

для генерации картинки нужно ввести от 1 до 60 слов (не менее 4 символов)
время генерации — от 10 до 20 секунд
размер изображения по умолчанию — 768х768
введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
изображение можно увеличить до 4096х4096
между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
между текстовым запросом и параметрами ставится точка с запятой ;
бесплатный режим — 5 токенов в BASE.
бесплатный режим — 10 токенов в BASE на изображения.

Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792

Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 токена за одну генерацию!!!

Текстовые запросы и параметры

Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.

num: 5 — количество генераций по одному запросу (на балансе должно быть от 10 токенов, максимум num=5)
color: sunset (доступно в v5) — градиент цветов для изображения. Можно менять 16 вариантов цветов: cold, spring, summer, autumn, sunset, tropic, night, bright, neon, blue, yellow, red, watercolor, oil, pastel, acrylic.

команда /default_params — в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)

Пример использования параметра style:

seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
width – ширина изображения. По умолчанию 768, максимум 1024
height – высота изображения. По умолчанию 768, максимум 1024

рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768

steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:

1 запрос

белый шпиц танцует, стоит на задних лапах

следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.

белый шпиц танцует, стоит на задних лапах, negative_prompt: пятая лапа, seed: 477457978, steps: 100

Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.

scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)

scale 5 — блеклое, естественное, как в пасмурную погоду

scale 10 — солнечное освещение, больше яркости

если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:

Не правильно 👇

высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза

Правильно 👇

красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к

чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).

девушка с розовыми волосами, украшения с бриллиантами на шее, seed: 6926903312

девушка с розовыми волосами, (розовые волосы:1.5), украшения с бриллиантами на шее, seed: 6926903312

чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:

девушка с розовыми волосами, [розовые волосы:0.5], украшения с бриллиантами на шее, seed: 6926903312

Примеры использования параметров в текстовых запросах:

лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
Марго Робби в стиле мультфильма «Холодное сердце», ледяное тело, вся одежда во льду, scale: 20
милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic

Стили

В модели V4

Стиль прописывается в текстовом запросе ДО параметров, до ;. Например: Портрет улыбающейся женщины с карими глазами и темными волосами, стиль Sand sculpture; v_model:v4