Генератор картинок: нейросеть рисует изображения по тексту
Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.
Полезные ссылки
@TurboText_bot — бот с искусственным интеллектом для замены фона и т.п.
Turbotext.ru/photo_ai — сайт с нейросетями для создания картинок и видео
Turbotext.pro — сайт для создания уникального текстового контента
Генератор изображений
Вам доступны четыре режима для картинок:
- создать изображение
- обработать
- анализ изображения
- улучшить запрос
Создать изображение
Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).
Доступны пять версий генерации изображений:
- V1 — версия для анимационных и мультяшных изображений.
- V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
- V3 — фотореализм, портретные снимки людей и животных.
- V4 — для абстрактных изображений, животных, природы, арт объектов. Доступно только для PRO media и тарифов покруче для медиа) — объединяет в себе возможности V1-V3, но с ограничениями на 18+, генерацию детей, знаменитостей, насилие и нарушающие законы изображения. Владельцы VIP-аккаунта могут получить картинку в разрешении 1792х1024 или 1024х1792 (списывается 5 токенов за 1 изображение)
v4 — ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.
- V5 — модель для генерации постеров, логотипов, креативных изображений с текстом (кроме 18+, насилия и нарушения законов). Доступные размеры: 1024х1024, 512х1536, 704х1408, 736х1312, 800х1280, 832х1248, 864х1152, 896х1120, 1120х896, 1248х832, 1280х800, 1312х736, 1408х704, 1536х512
Параметры V5:
- скорость генерации: 30-40 секунд
- ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
- данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
- тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
- можно подобрать надпись на русском, если использовать латинские буквы
- модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
- в V5 доступны такие размеры генерации картинок: 1280х720, 1232х768, 1024х1024, 1152х768, 1024х768, 720х1280, 768х1232, 768х1152, 768х1024
- максимальный размер картинки — 1536 пикселей
- есть поддержка разных соотношений сторон (1:3, 1:2, 2:3, 3:4, 4:5, 9:16, 10:16)
- smart_off — если указать smart_prompt: off, то нейросеть не будет менять запрос пользователя (по умолчанию меняет). Использование параметра полезно, когда надо достигнуть большего реализма и соответствия результата запросу
По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2
Примеры запросов:
рыжий кот сидит на крыше; v_model: v1
красивая девушка стоит на берегу моря; v_model: v2
Примеры изображений
V5
Модели v1, v2, v3, v4, v5
Анализ изображений
Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.
Примеры анализа изображений:
Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.
TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:
Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.
Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.
Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.
Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.
На схеме показаны следующие компоненты:
Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.
Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.
Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.
Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.
Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.
Насос: это устройство, которое перекачивает воду под давлением в реактор.
Возможности и ограничения
Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.
- для генерации картинки нужно ввести от 1 до 60 слов (не менее 4 символов)
- время генерации — от 10 до 20 секунд
- размер изображения по умолчанию — 768х768
- введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
- изображение можно увеличить до 4096х4096
- между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
- при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
- между текстовым запросом и параметрами ставится точка с запятой ;
- бесплатный режим — 5 токенов в BASE.
- бесплатный режим — 10 токенов в BASE на изображения.
- PRO-режим или Ultra (вместе с токенам в текстах) — по 100 токенов в каждом режиме в PRO_media и по 50 токенов в каждом режиме PRO text (стоимость PRO text 150, PRO_media 160 и Ultra 270 ₽)
- PRO_media+ и PRO text+ — 720 токенов в PRO_media+ , 300 токенов в PRO text+ (стоимость PRO text+ 530 ₽, Media+ 570 ₽)
- ULTRA+ — Все возможности тарифа PRO_text+ и PRO_media+ (стоимость 1090 ₽)
- VIP-тариф — 10000 токенов для генерации изображений + 5000 токенов для текстов (стоимость 5100 ₽)
Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792
Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 токена за одну генерацию!!!
Текстовые запросы и параметры
Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.
- команда /default_params — в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
- style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)
Пример использования параметра style:
- seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
- width – ширина изображения. По умолчанию 768, максимум 1024
- height – высота изображения. По умолчанию 768, максимум 1024
рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768
- steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
- negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:
1 запрос
следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.
Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.
- scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)
- если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
- каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:
Не правильно 👇
высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза
Правильно 👇
красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к
- чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).
- чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:
Примеры использования параметров в текстовых запросах:
- лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
- морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
- вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
- Марго Робби в стиле мультфильма «Холодное сердце», ледяное тело, вся одежда во льду, scale: 20
- милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
- Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
- животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
- постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic
Стили
В модели V4
Стиль прописывается в текстовом запросе ДО параметров, до ;. Например: Портрет улыбающейся женщины с карими глазами и темными волосами, стиль Sand sculpture; v_model:v4
стиль Sand sculpture
стиль Bronze statue
стиль Roman mosaic
Другие стили
В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.
В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).