Генератор картинок: нейросеть рисует изображения по тексту
Генератор изображений TurboText позволяет за несколько секунд получить уникальную картинку по текстовому запросу. Мы подготовили рекомендации и примеры, которые помогут получить качественный результат и упростить работу с нейросетями. Изучите руководство до конца, чтобы лучше взаимодействовать с искусственным интеллектом и генерировать хорошие изображения с первого запроса.
Генератор изображений
Вам доступны четыре режима для картинок:
- создать изображение
- обработать
- анализ изображения
- улучшить запрос
Создать изображение
Раздел для генерации картинок нейросетью. Вы вводите текстовый запрос, а искусственный интеллект рисует подходящее изображение. Старайтесь формулировать запрос точнее, чтобы результат нейросети соответствовал вашим ожиданиям. Также вы можете использовать параметры в текстовых запросах (style, seed, steps, negative_prompt и другие. подробнее о параметрах ниже в разделе «Текстовые запросы и параметры»).
Доступны пять версий генерации изображений:
- V1 — версия для анимационных и мультяшных изображений.
- V2 — для кинематографических сценариев и сцен с тёмными эффектами. Мультяшная и кинематографическая модель
- V3 — фотореализм, портретные снимки людей и животных.
- V4 — это объединение версий v1-v3. Для абстрактных изображений, животных, природы, арт объектов. Эта модель лучше распознает текстовый запрос и может рисовать картинки в разных стилях: как в реалистичном, так и в анимационном. Разрешение изображения по умолчанию 1024×1024.
v4 — ограничения!!! В режиме v4 запрещено генерировать контент 18+, в том числе легко эротический контент, знаменитостей, города, достопримечательности. В случае запроса вышеперечисленных тематик картинка будет сгенерирована в версии v1.
- V5 — модель для генерации постеров, логотипов, креативных изображений с текстом.
Параметры V5:
- скорость генерации: 30-40 секунд
- ограничения на использование: 18+, насилие, наркотики и символика, нарушающая законы ряда стран
- данные V5 не являются конфиденциальными и могут быть использованы для дообучения нейросети
- тексты для изображений генерирует только на английском языке. Запросы на русском языке автоматически переводятся на английский
- можно подобрать надпись на русском, если использовать латинские буквы
- модель умеет рисовать знаменитостей и брендовые компании, в отличие от модели V4
- в V5 доступны такие размеры генерации картинок: 1280х720, 1232х768, 1024х1024, 1152х768, 1024х768, 720х1280, 768х1232, 768х1152, 768х1024
- vаксимальный размер картинки увеличен с 1024 до 1280 пикселей (в 9:16 и 16:9)
- соотношения сторон: 2:3, 3:4, 10:16, 9:16, 3:2, 4:3, 16:10, 9:10, 1:1
- smart_off — если указать smart_prompt: off, то нейросеть не будет менять запрос пользователя (по умолчанию меняет). Использование параметра полезно, когда надо достигнуть большего реализма и соответствия результата запросу
По умолчанию установлена модель v3. Чтобы применить нужную версию, используйте параметр v_model в таком формате: v_model: v2
Примеры запросов:
рыжий кот сидит на крыше; v_model: v1
красивая девушка стоит на берегу моря; v_model: v2
Примеры изображений
V5
Модели v1, v2, v3, v4
Анализ изображений
Нейросеть для анализа картинок. Для работы с функцией загрузите любое изображение и добавьте текстовый запрос, что именно нейросети нужно сделать. ИИ может таким образом разгадывать загадки, считывать текст на фото, описывать процессы, изображенные на картинке, и многое другое.
Примеры анализа изображений:
Ответ: TurboText — это облачный инструмент копирайтинга с искусственным интеллектом, который помогает компаниям создавать высококачественный контент в больших масштабах. Его можно использовать для создания различных форматов контента, включая сообщения в блогах, статьи, описания продуктов, сообщения в социальных сетях и рекламу. TurboText основан на языковой модели OpenAI GPT-3, которая позволяет ему генерировать контент человеческого качества, который является одновременно информативным и интересным.
TurboText предлагает множество функций, которые упрощают создание высококачественного контента для предприятий, в том числе:
Удобный интерфейс: TurboText может использовать любой, независимо от его технических знаний.
Широкий выбор шаблонов. TurboText предлагает широкий выбор шаблонов для разных типов контента, что упрощает начало работы.
Ответ: Этот мем о том, что коты всегда готовы повеселиться. В 6 утра они будят свою хозяйку Наташу, чтобы она им помогла выбраться. На фото изображены различные породы кошек, в том числе турецкий ангорский, турецкий ванд, кашмирский, домашний длинношерстный, азиатский полудлинношерстный и персидский.
Ответ: Диаграмма показывает компоненты атомной электростанции. Атомная электростанция — это тип электростанции, которая использует ядерную энергию для производства электроэнергии.
На схеме показаны следующие компоненты:
Парогенератор: это устройство, которое превращает воду в пар при соответствующем условии.
Бетонная оболочка: это защитная оболочка, которая окружает реактор и обеспечивает утечку радиации.
Вода под давлением: это теплоноситель, который переносит тепло от реактора к парогенератору.
Структурная каркасная конструкция: это несущественная конструкция, поддерживающая бетонную оболочку и другие компоненты реактора.
Регулирующие стержни: это стержни, которые установлены в реакторе для регулирования режима режима.
Насос: это устройство, которое перекачивает воду под давлением в реактор.
Возможности и ограничения
Модель работает на базе архитектуры Stable Diffusion с дообучением на изображениях в стиле Midjourney.
- для генерации картинки нужно ввести от 1 до 60 слов (не менее 4 символов)
- время генерации — от 10 до 20 секунд
- размер изображения по умолчанию — 768х768
- введите в текстовом запросе размер 1024х1024, чтобы повысить качество картинки (например, «Милый толстый рыжий кот в очках и ковбойской шляпе играет на гитаре в весеннем лесу, width: 1024, height: 1024)
- изображение можно увеличить до 4096х4096
- между словами в текстовом запросе необходимо ставить запятые. Количество пробелов на результат не влияет
- при запросе с разрешением 1024х1024 нейросеть генерирует только одно изображение
- между текстовым запросом и параметрами ставится точка с запятой ;
- бесплатный режим — 10 попыток
- PRO-режим или Ultra (вместе с попытками в текстах) — по 100 попыток в каждом режиме (стоимость 150 и 270 ₽)
- PRO image+ и PRO text+ — 720 попыток в PRO image+, 216 попыток в PRO text+ (стоимость 630 ₽ и 590 ₽)
- ULTRA+ — Все возможности тарифа PRO_text+ и PRO_image+ (стоимость 1090 ₽)
- VIP-тариф — 10000 попыток для генерации изображений + 3000 попыток для текстов (стоимость 6 000 ₽)
Пользователи с тарифом VIP могут генерировать изображения в разрешениях 1792х1024 и 1024х1792
Обратите внимание: С 1 октября за генерацию изображений 18+ (эротика, секс, обнаженка) в боте будет сниматься 2 попытки за одну генерацию!!!
Текстовые запросы и параметры
Чтобы изображения получались с первого раза, прорабатывайте текстовый запрос как можно более точно: указывайте детали, стили, дополнительные элементы и т.п. Ниже список подсказок по параметрам, которые можно добавлять в текстовые запросы.
- в моделях v4 и v5 пользователи бесплатного тарифа получают 2 варианта изображения по одному запросу; платные тарифы — 3 изображения.
- команда /default_params — в ней сможете указать параметры по умолчанию, которые будут использоваться в генерации изображений (width, height, style и т.д.). Сделано для того, чтобы не приходилось вводить их вручную постоянно.
- style — стиль изображения. Этот параметр нужно добавить в запрос и через двоеточие указать желаемый стиль — style: realism. Также доступны такие стили: realism, cartoon, anime, cinematic, cyberpunk, steampunk, portrait, dark. Стиль по умолчанию — realism. (не доступно в моделях V4 и V5)
Пример использования параметра style:
- seed – идентификатор изображения. Чтобы получить одно и то же изображение, вводите одинаковый seed. (не доступно в моделях V4 и V5)
- width – ширина изображения. По умолчанию 768, максимум 1024
- height – высота изображения. По умолчанию 768, максимум 1024
рекомендуется использовать такие размеры: 1024х1024, 1024х768, 768х1024, 768х768
- steps – кол-во шагов. Чем больше шагов, тем выше детализация картинки. Максимально возможное количество шагов — 100 при разрешении не более 768х768. При разрешении 1024х1024 максимальное количество шагов 55, устанавливается автоматически. (не доступно в моделях V4 и V5)
- negative_prompt – удаление отдельных деталей на картинке (лишние части тела, предметы, животных). Для активации параметра нужно повторить запрос к картинке, на которой нужно удалить объекты, и зафиксировать seed. (не доступно в моделях V4 и V5). Как на примере ниже:
1 запрос
следующий запрос для устранения лишней лапы. Фиксируем seed и максимально увеличиваем количество шагов steps.
Запросов в negative_prompt можно перечислить несколько через запятую, но в таком случае параметр лучше размещать в конце всего текстового запроса. Нейросеть реагирует на одно-два слова в запросе negative_prompt, фразы из 3+ слов не влияют на результат.
- scale — уровень контрастности изображения. Диапазон значений — от 1 до 20 (не доступно в моделях V4 и V5)
- если на изображении необходимо выделить детали, то прописывайте такие параметры:((сложные детали)), hdr, ((сложные детали, гипердетализация)), высокая детализация. (не доступно в моделях V4 и V5)
- каждое слово в текстовом запросе имеет приоритет над следующим, поэтому самое важное следует располагать ближе к началу. Чем дальше от начала идет слово, тем меньший вес оно имеет. Например:
Не правильно 👇
высокая детализация, 4 к, темный густой лес, красная шапочка сидит на пеньке, яркие большие голубые глаза
Правильно 👇
красная шапочка сидит на пеньке, яркие большие голубые глаза, на фоне темный густой лес, высокая детализация, 4 к
- чтобы повысить вес токена, используйте коэффициент усиления от 0.1 до 2 (оптимально – от 0.5 до 1.5) в таком формате — (токен:коэффициент). Чем выше установлен коэффициент, тем больше приоритета нейросеть отдаст токену. Круглые скобки нужны для отделения ключевых слов и повышения их веса. (не доступно в моделях V4 и V5).
- чтобы снизить вес токена в текстовом запросе, используйте квадратные кавычки []. (не доступно в моделях V4 и V5). Например:
Примеры использования параметров в текстовых запросах:
- лошадь в смокинге, фотореалистичный, 8k, высокое разрешение, высокая детализация, драматическое освещение, кинематографичный, установочный снимок, чрезвычайно высокая детализация, seed: 123456789, width: 1024, height: 1024
- морское чудовище, фэнтези-арт, цифровая живопись, плавный, четкий фокус, цифровая иллюстрация, очень детализированное, seed: 123456789, steps: 100, width: 1024, height: 768
- вулкан на пляже, красивый закат, драматическое освещение, кинематографический, установочный снимок, чрезвычайно высокая детализация, объемное освещение, световые лучи, seed: 987654321, width: 1024, height: 1024, steps: 100
- Марго Робби в стиле мультфильма «Холодное сердце», ледяное тело, вся одежда во льду, scale: 20
- милый щенок на снегу в ботинках, (ботинки:1.2), красный ошейник, (голубые глаза:1.5), seed: 864038316
- Комиссар Грета Тунберг, Warhammer 40000, злая, ((сложные детали)), детализированные глаза, hdr, ((гипердетализация)), кинематографический кадр, виньетка
- животное, портретное фото [man:cat:5] человекоподобный в одежде, лицо
- постер к фильму «Взрыв мозга», экшен-сцена, невероятные спецэффекты; style: cinematic
Стили
В модели V4
Стиль прописывается в текстовом запросе ДО параметров, до ;. Например: Портрет улыбающейся женщины с карими глазами и темными волосами, стиль Sand sculpture; v_model:v4
стиль Sand sculpture
стиль Bronze statue
стиль Roman mosaic
Другие стили
В V4 добавлены стили художников Mark Ryden, Ryohei Hase, Anton Semenov, Shaun Tan, Tizian, Warhole.
В моделях V2 и V3 доступны стили по ссылке https://sdxl.parrotzone.art/ (название стиля и примеры к нему).
Стили и примеры генерации (доступны для моделей V1-V3):
Ralph McQuarrie — простые формы ретрофутуризм
Syd Mead — детальные как картины ретрофутуризм
Robert McCall — старый ретрофутуризм без деталей
Klaus Burgle — ч/б фото ретрофутуризм
Ron Cobb — стильные картины, баланс, формы
John Berkey — черезчур детальное, путается
Norman Rockwell — ретрофутуризм
Tristram James Ellis, Michelangelo — античное нежное
Albert Bierstadt — древности, ренессанс
Georges Desvallières — более современное, но все еще старинное
Peregrine Heathcote — упрощённые абстракции
Giovanni Battista Piazzetta — ренессанс
Valentin de Boulogne — ЛЮТЫЙ ренессанс
Ivan Aivazovsky — вода
Ivan Shishkin — деревья, небо
Asher Brown Durand — навроде Шишкина, растения
Maxfield Parrish — навроде Шишкина, нежное
Hans Thoma — детальные ландшафты вроде Шишкина
Thomas Kinkade — красивые пейзажи точками, нежные
Asher Brown Durand — футуризм ландшафты, хорошо сочетается с классикой
Gustave Dore — ЧБ старинные детальные ландшафты вроде Шишкина
gonzalo fuenmayor — ЧБ окружения
Eddie Mendoza — футуризм
Ryan Dening — футуризм
Thomas Kinkad — красочный футуризм
Tyler Edlin — мрачный детальный футуризм
Blizzard Concept Artists — футуризм
Sparth Liang Mark G Liulian Craig Mullins, Finnian MacManus — красивые ландшафты/виды
James Gurney — красиво, растения, динозавры
George Stubbs — красочные спокойные иллюстрации
Kawase Hasui — красочные спокойные ландшафты
Jakub Różalski — около-классические ландшафты
Anton Fadeev — красочные яркие ландшафты
Anato Finnstark — красочные яркие ландшафты
Ismail Inceoglu — красочные яркие ландшафты
Finnian MacManus — футуризм ландшафты окружения
Stefan Koidl — около-сталенхаг
Simon Stalenhag -—сталенхаг
Ludwig Deutsch and Rudolf Ernst — около-сталенхаг
Brock Hofer — линии
Wes Anderson — линии
Denis Villeneuve — линии
Jean Giraud — красивые персонажи сглаженные и абстрактные
Tom Bagshaw — красивые персонажи сглаженные и абстрактные
Edward Hopper — красивые персонажи сглаженные и абстрактные
Rene Margitte — красивые персонажи сглаженные и абстрактные
artgerm — персонажи
Alexander Trufanov — персонажи
Andrei Riabovitchev — красивые персонажи
James Jean — красивые персонажи
Edward Robert Hughes, Henry Justice Ford — красивые персонажи
Rolf Armstrong, Monia Merlo — красивые персонажи
Kezie Demessance — красочные персонажи
Ha Gyung — красочные персонажи
Zac Retz — красочные персонажи
Peter Mohrbacher — красивые персонажи и ландшафты (MTG стиль)
Portrait painting by Arthur Rackham, Eugene de Blaas, Frederic Leighton
— иллюстрации
Naranbaatar Ganbold — детальная прорисовка ЧБ форм персонажей
Katsuya Terada — интересные чб абстрактные персонажи
Alexandros Pyromallis Intaglio — ЧБ персонажи
Marc Simonetti — мрачные эпичные ландшафты
Jonathan Solter -— эпичные ландшафты
Greg Rutkowski — мрачные персонажи-ландшафты
sidwill — мрачные персонажи
Dragan Bibin — мрачные персонажи
Frank Frazetta — мрачные персонажи
jacques callot — чб гравюры детальные
Pieter Claesz — чб гравюры книжные
Geof Darrow — цветные иллюстрации! с линиями
Hasui Kawase — традиционное японское
Zdzisław Beksiński — всякое стрёмное
Wayne Barlowe — всякое стрёмное
Arthur Rackham — всякое стрёмное
Dariusz Zawadzki — всякое стрёмное
Ute Osterwalder — экспериментальные персонажи
Hajime Sorayama — экспериментальные персонажи
Carlos Schwabe — экспериментальные персонажи
Adolf Hirémy-Hirschl — экспериментальные персонажи
Carl Spitzweg — крутые грубые мазки и свет