Что важно знать о Dezgo

Для начала предупреждение. Всё, что написано в данном руководстве – преимущественно мои личные выводы, сделанные преимущественно в результате экспериментирования с Dezgo, они не основаны на глубоком понимании нейросетей (коего у меня совершенно нет) или на системном изучении неких справочных описаний (кое-куда я заглядывал, но отрывочно, одним глазом, более, чтобы увидеть, какие можно использовать интересные стили рисования или команды). Это любительское руководство от любителя, которое может ввести вас в какой-то мере в заблуждение в каких-то аспектах – наверняка не все мои выводы верны. Наверняка в чём-то я ошибаюсь, в чём-то не прав. Тем не менее, если вы тоже новичок в деле рисования в нейросетях и ещё не работали с Dezgo, уверен, оно неплохо поможет вам начать и сэкономит сколько-то времени. Как минимум я надеюсь на это. Ну а теперь переходим к собственно теме нашего разговора.


Dezgo – это сайт, содержащий основанные на нейросетях функции рисования и работы с рисунками. В данный момент он может генерировать картинки по текстовому описанию, редактировать картинки по текстовому описанию, увеличивать картинки вдвое, удалять фон у картинок, заменяя его на прозрачный, создавать чёрно-белые маски картинок. Не статичен, в том смысле, что его постепенно развивают и улучшают, что-то в нём меняется время от времени, потому всё здесь сказанное про него надо воспринимать именно в ключе текущего момента, в будущем оно может и измениться, в чём-то утратив соответствие. Dezgo позволяет работать с ним бесплатно, никак не ограничивая в количестве производимых операций и генерируемых картинок. У него есть платный режим, но как будто и бесплатный ни в чём важном не урезан, чуть медленнее работает, не позволяет генерировать более одной картинки за раз, вот фактически и всё. Впрочем, я не пользовался платным режимом и потому не могу ничего утверждать наверняка. Не требует регистрации. Главный недостаток Dezgo – мелковатость картинок у большинства функций. Всего лишь 672x384 или 384x672, и даже менее. У него есть XL функции, позволяющие генерировать изображения в размерах 1016x576 или 576x1016, но от них сложнее добиться качественности графики, особенно при рисовании людей, а перерисовка и редактирование в этих размерах вообще не предусмотрены. У него есть недавно добавленная flux-функция, эта рисует ещё крупнее – 1344x768, и довольно качественно. Только она не поддерживает специальные команды Dezgo, не имеет никаких настроек, что достаточно сильно ограничивает её возможности (в сравнении с другими функциями), хотя в целом они неплохи. Тоже не предусматривает перерисовок в функциях редактирования. Ну и важно отметить, и XL и Flux функции Dezgo работают медленнее, чем функции, рисующие мелко, потому последними пользоваться удобнее.

Далее значимые особенности Dezgo я всё же выделю в список, чтобы они были отчётливее для восприятия:


1) Большинство его функций содержат в себе не одну, а множество нейросетей, из которых вам дано задавать в качестве параметра нужную. Например, в данный момент у него 31 вариант нейросетей в функции генерации по тексту картинок размера 672x384. Одни рисуют реалистично, другие в стиле аниме, третьи ещё как-то, каждая нейросеть по-своему воспринимает задаваемые вами тексты, несколько отлично от других, имеет свои особенности понятливости ваших запросов, их интерпретации, готовности им следовать, и т.д. Ну и конечно создаёт свой собственный уникальный контент – рисует иное и иначе, чем прочие.

2) У него есть 4 функции перерисовки (как бы редактирования) картинок. Из них минимум две – это всё же генераторы картинок, они ничего вам не редактируют, они создают новые картинки, руководствуясь содержимым предоставленной исходной картинки. Они распознают это содержимое и рисуют примерно в таком же виде, а вы можете задать текстом, что желаете изменить, чтобы оно выглядело как-то по-другому. Лучше всего функции Dezgo распознают и воссоздают только то, что исходно нарисовано в нём, то есть лишь исходно сгенерированные в нём изображения они способны воспроизвести с точностью, близкой к 100% (при определённых условиях). Сторонние картинки вам навряд ли удастся перерисовать хоть сколько-то похоже – и физиономии персонажей, и их одежда и фон изменятся вероятнее всего кардинально. Лишь одна функция из указанных 4-х позволяет полноценно редактировать и сторонние картинки, а именно «Inpainting from text».

3) У редактирования изображений путём их полной перерисовки есть пара непреложных достоинств. Во-первых, конечная полученная картинка фактически никак не зависит ни от качества, ни от размеров исходной картинки. Вы можете подсунуть последнюю самого низкого качества, самых миниатюрных размеров – если её содержимое можно распознать, вы получите на выходе рисунок очень похожего содержания в полном размере и полном качестве. Во-вторых, возможности преобразований перерисовываемого графического контента ничем не ограничены. Поменять фон, поменять персонажу позу на абсолютно любую другую, переодеть его во что угодно, заменить ему физиономию, поменять пол, изменить возраст на любой другой в любом диапазоне, хоть с 80 лет на 5 или наоборот. Поменять положение в кадре, дорисовав части тела, которые ранее были за кадром. Вырезать из картинки кусок в фотошопе и перерисовать его в полный размер, либо дорисовать к нему другие детали, скажем, сохранив только лицо, сгенерировать персонажу новое тело, или сохранив кусок тела, сгенерировать всё остальное включая лицо. Делай вообще что хочешь. Правда не всё так просто. Добиться, чтобы при перерисовке картинка изменилась именно так, как вам надо – целое искусство, каковое освоить нелегко.

4) Отдельные функции редактирования Dezgo удивят вас убойно низким качеством картинок или же излишне малыми их размерами. Но эти картинки не обязательно воспринимать как конечный результат, можно как промежуточный, как редактирование более удобным способом с целью последующей перерисовки для получения в полном качестве и размере.

5) Цензура в Dezgo распространяется только на несовершеннолетних персонажей. Взрослых рисуй в чём угодно, занимающихся чем угодно. Впрочем, каждая нейросеть реализует цензуру по-своему и устремлена к разному контенту, не все нейросети Dezgo соответствуют двум указанным мной моментам. Но большинство кажется соответствует. Преимущественно цензура проявляется в увеличении возраста. То есть когда персонаж, которого вы указали нарисовать юным, рисуется взрослым – если сеть решила, что вы пытаетесь отобразить его в неподобающем виде. Иными словами, она всё равно его нарисует, именно в указанном виде, просто он будет старше, чем вы заказывали.

6) Вследствие пункта 5, Dezgo, при всех его замечательных возможностях, не та игрушка, которую посоветуешь, допустим, своему ребёнку. В нём обнажение не считается чем-то предосудительным и потому может произойти даже без каких-либо указаний на то с вашей стороны непредсказуемым образом. Иные его нейросети чуть ли не всякое ваше слово способны интерпретировать как намёк на пожелание минимализма в нарядах. И охотно воплотят его в графике. А порой обходятся и вообще без намёков.

7) Все тексты с указаниями, что и как рисовать, Dezgo принимает только на английском. Благо ныне есть онлайн переводчики.

8) По моим ощущениям (в коих я всё же не уверен на 100%) Dezgo не любит (бесплатную) работу с ним в несколько окон. Если вы откроете в браузере несколько его окон и станете генерировать несколько картинок одновременно, судя по моему опыту, вы получите за одно и то же время меньшее число изображений, а не большее, так как на генерацию каждого будет уходить заметно более времени. Надо открыть одно окно через ВПН, а другое без ВПН, вот тогда вы сможете рисовать по две картинки без замедления.

9) Dezgo практикует очень оригинальный подход к сохранению информации. Он записывает непосредственно в картинку всё, что вы задали для её рисования. Включая текст, по которому она была сгенерирована, включая текст с перечнем запрещённых вами к отрисовке объектов (negative prompt). С одной стороны это чрезвычайно удобно, вы всегда можете посмотреть у удачной картинки, как она была получена, дабы попытаться сгенерировать что-то подобное. В ней будут все необходимые сведенья. С другой, чтобы пользоваться столь знаменательной особенностью, надо как минимум о ней знать. А каким образом человек может получить это знание? Я не очень понимаю. Зацените, как его получил я. Догадался. Я никогда не слышал, чтобы текстовую информацию записывали внутрь графических файлов, даже не предполагал, что такое возможно. Но вот подумал, дай-ка проверю, не сохраняет ли Dezgo что-нибудь лишнее в картинках. Был уверен, что вряд ли, но так, на всякий случай, убедиться-то недолго. И вот те раз. Оказалось, у файлов jpg есть параметр «комментарий». В нём и сохраняются все данные. Но обратить на них внимание, если ты специально не озаботился этим, невозможно. Их невозможно заметить случайно (в принципе я не знаю, может быть в более новых версиях виндоус всё иначе, может там комментарии в подсказках подсвечиваются). Ну а у файлов png и вовсе такая структура, куда записывай всё что угодно, это не комментарий, оно вообще нигде не отображается. В результате получаем, что большинству людей пользы от данной особенности Dezgo никакой, а вот вред пожалуй есть – если вы разместите свою картинку в интернете, любой, кому хватит ума открыть её блокнотом, сможет в точности узнать, что вы писали для её получения. Определённо не всем авторам картинок понравится такой расклад. Ну, теперь вы знаете. Подробней о формате данных, сохраняемых в картинках, и о том, как от них при желании избавиться, я расскажу в предпоследней главе. Также могу предложить вам в качестве инструмента их просмотра и отчасти удаления из файлов свою программу «Dezgo Params Viewer». Написал специально для данного руководства. Скачать можно тут: https://dvo.my1.ru/DezViewer.htm. О ней чуть подробней я тоже расскажу в предпоследней главе.


Ну и ещё кое-что. В Dezgo очень много нейросетей. Суммарно более 40 на данный момент. И они совсем не одинаковы. Они не только рисуют по-разному, но и работают по-разному, и даже понимают вас каждая не так, как остальные. Как минимум в некоторых аспектах. Например, одна на слова «kitten mood» (в переводе что-то вроде «настроение игривого котёнка») иногда рисовала мне персонажа именно в настроении котёнка, это было чётко опознаваемо – поза, выражение лица, и никогда не рисовала котят, а другая рисовала только котят, и никакого тебе влияния на настроение. Одна на слова «splashes colors» создавала фон из вызывного разноцветия брызг и иных водных образований, а другая разноцветно размулёвывала только одежду персонажа, фон же оставляла банальным обыденным, и эффектов с водой ноль. Некоторые нейросети не распознают общепринятых сокращений, каковые большинство других сетей распознают, некоторые не реагируют на отдельные параметры. Некоторые склонны игнорировать сложные образы или какие-то противоречивые, некоторые наоборот, каждое твоё слово пытаются понять и задействовать при формировании картинки. Ну и так далее. Кстати, отдельные параметры могут вызывать смену механизмов действия нейросети. Вставляете в свой текст какое-то слово, и реакция на ваш текст вдруг меняется в той или иной степени. Ну то есть даже одна сеть может быть в действительности словно смесью сетей, из которых в разные моменты подключается нужная. Я это к чему говорю? Чтобы протестировать 40 разных сетей, нужен уже какой-то исследовательский коллектив, одному человеку такое наверное не под силу, да и вроде незачем. Я в Dezgo экспериментировал преимущественно с сетью «RealDream 12», ну и также в какой-то мере с «Envy Starlight XL 01 Lightning» и «JuggernautXL 9 Lightning» (первая рисует картинки обычного размера, прочие две размеров XL), а большинством остальных пользовался прям по чуть-чуть, лишь чтобы посмотреть, что они вообще могут. Почему именно эти сети я выбрал? RealDream тебе предлагают по умолчанию, то есть она уже выбрана, когда ты заходишь на Dezgo, ну а так как приходя на него, ты ничего не знаешь, что и зачем надо выбирать, всё равно начнёшь работу с ней, что со мной и произошло. В принципе она неплоха, качество мне нравится, единственно, тяготеет к рисованию преимущественно в одном стиле – реализме. Что касается Envy и Juggernaut9, я долгое время как-то и не знал, что тут есть рисование в размерах XL, не обращал внимания, а когда увидел, выбор нейросетей там был невелик, что первое чуть более приглянулось, тем и стал пользоваться. В общем, всё, о чём здесь далее пойдёт речь, прежде всего имеет отношение к «RealDream 12», несколько менее к «Envy Starlight XL 01 Lightning» или «JuggernautXL 9 Lightning», и не факт, что будет точно так же работать и в других сетях, а иногда не будет работать в каких-то отдельных сетях вовсе, в отдельных случаях. Имейте это в виду.


Сайт Dezgo: https://dezgo.com

Сайт, куда Dezgo направляет за справкой:

https://www.reddit.com/r/stablediffusion/wiki/tutorials

Блог Dezgo: https://blog.dezgo.com


Загрузка...