Текст для генерации картинок (промпты)

Здесь я чуть подробнее расскажу о настройке «prompt» функций. Той, в окно которой вы задаёте текст, описывающий контент генерируемой или перерисовываемой картинки. В русском сегменте интернета вследствие неё тексты для генерации картинок собственно и называют «промптами», только я бы не сказал, что для русского языка данное название удобно для произношения, далее я всё же преимущественно буду называть эти тексты «текстами». Или буду использовать слово «prompt» для уточнения. Когда моё руководство было уже практически готово, я вдруг заметил, что Dezgo осчастливил нас очередным новшеством – на его сайте появилась ссылка «Blog» (https://blog.dezgo.com). Перейдя по ней, я нашёл кое-что интересное, в том числе на тему текстов. И пришлось мне дополнять свою писанину ещё одной главой. Ну, тут я постараюсь быть максимально краток. В первую очередь стоит сказать, тексты, задаваемые ИИ (искусственному интеллекту) характеризуются длиной, и она измеряется в специальных единицах – так называемых «токенах». Кажется, этот термин используется для миллиона разных вещей, включая криптовалюты, так что не надо путать, тут у него иное значение. Токен – в данном случае это именно единица длины и ничего более, величину она имеет переменную, в среднем равняясь четырём символам, однако многие слова являются самостоятельными токенами (то есть любое из них любой длины равно одному токену). Почему это для нас важно? Потому что все генераторы изображений с искусственным интеллектом, основанные на Stable Diffusion (включая и Dezgo), имеют ограничение текстов по длине, после которого слова просто игнорируются. В настоящее время это ограничение составляет 77 токенов. Как определить число токенов в вашем тексте, раз они неизмеримы простыми средами (вы же не знаете, какие слова равны одному токену, а какие нет)? Dezgo предлагает вам для этого пользоваться специальным сайтом – онлайн токенизатором: https://novelai.net/tokenizer


Второй момент: словам в начале текста придается большее значение, чем словам в конце. Если вам не нравится получившаяся картинка, вы можете изменить порядок слов, а не менять текст полностью. В качестве примера на сайте приводятся две картинки – созданная по тексту «1 girl, classroom» и по «classroom, 1 girl». На первой картинке школьница крупным планом, на второй – школьный класс, где за одной из парт сидит школьница, то есть она гораздо более мелко нарисована, там она не главный объект, главный объект именно помещение класса.


Третий момент: если вы используете для генерации картинок сторонние тексты из интернета, составленные для других нейросетей (не для Dezgo), следует учитывать, что Dezgo не поддерживает их особый синтаксис вроде квадратных скобок, нескольких круглых скобок, и т.п. Проще говоря, в Dezgo в качестве специальных команд используются плюсики и минусики, а в других сетях применяются иные механизмы – где-то заключение в квадратные скобки, где-то в множество круглых «(((1 girl, classroom)))». В Dezgo все подобные специальные команды работать не будут.


Четвёртый момент: избегайте допускать грамматические и иные ошибки. Искусственный интеллект далеко не всегда сможет понять вас правильно. Лично по моему опыту часто ему всё равно, всё понимает. Но порой нет, например, я допустил опечатку в тексте «(Strangel world)+++. Strange nature» – лишнюю «L» поставил в тексте «странный мир, странная природа». И мне разные сети вместо странного мира стали генерировать изображение летящего примитивного (пропеллерного) самолёта.


Пятый момент добавлю от себя. Первая генерация по вновь заданному или вновь исправленному тексту иногда может происходить нестандартным образом, иным, чем в последующие. Потому если вы задали какой-то текст, и у вас первая картинка выпала интересная, а потом сколько попыток ни делаете, всё уже не то, вероятнее всего это не случайность, что именно первая была иная, это закономерность. Такое относительно редко бывает (с нестандартностью первого срабатывания), тем не менее бывает, это надо иметь в виду.


Ну и напоминаю, всё написанное вами в окне «prompt» будет сохранено непосредственно в файлах картинок (исключая формат WebP). Достаточно открыть картинку блокнотом, и в самом её начале вы обнаружите среди прочего текст, по которому она была сгенерирована.

Дополнительную информацию вы можете найти здесь:

https://blog.dezgo.com/2024/07/advanced-prompting-technique.html


Загрузка...