ym104432846
Вставьте ссылку на видео из Youtube, Rutube, VK видео
Задайте вопрос по видео
Что вас интересует?
00:00:06
Сборка датасета для обучения модели:
  • 1. Рассматривается метод сбора датасета для обучения модели на основе внешнего вида людей
  • 2. Пример внешности был найден спикером через сервис Pinterest
  • 3. Дальнейшие шаги спикера будут демонстрироваться на указанном примере
00:00:51
Удаление лишнего с изображений:
  • 1. Необходимо сосредоточиться на выделении главной модели (телефона), оставив второстепенные элементы (шапки, аксессуары)
  • 2. Рассматривается возможность удаления звездочек и веснушек с фотографии
  • 3. Предлагается вариант обработки изображений через инструмент inpatient (возможно, коррекция цвета или ретушь)
00:01:36
Использование языковой модели Джимина:
  • 1. Использовать языковую модель Джимена для работы с картинкой и удаления смартфона из закрытой телеграм-группы
  • 2. Сохранять картинки, удалять шапки и аксессуары, используя предложенный метод перетаскивания изображений
  • 3. Подготовить итоговый результат, отправить его и дополнительно обработать изображение вручную в фотошопе
00:03:11
Изменение цвета волос и причесок:
  • 1. Созданы фотографии с измененным цветом волос и разными прическами
  • 2. Запущен рабочий процесс апскейлинга с использованием новой версии программы Sit Viar 2
  • 3. Запущена генерация изображений через выбранную модель, результаты которой выложены в Telegram-канал
00:06:13
Апскейлинг и работа с маской:
  • 1. Разработан способ выделения лица по маске с возможностью отключения волос, тела, одежды и фона
  • 2. Качество работы инструмента оценивается положительно («неплохо», «очень даже неплохо»)
  • 3. Инструмент позволяет выделить лицо, оставив остальные части маски неизмененными
00:08:34
Настройка уровня шума и контрастности:
  • В настройках модели регулируется контрастность, шум и степень его размывания
  • Настройки включают максимальный уровень частоты пикселей и минимизацию шума (ультра-режим)
  • Увеличение уровня шума усиливает детализацию и резкость генерируемого изображения
00:11:32
Оценка качества генерации:
  • 1. Улучшена детализация изображений (логотипа, колец, ногтей, цепочки, кружев, волос, глаз)
  • 2. Добавлена реалистичная текстура кожи и возможность наложения текстур для имитации татуировок
  • 3. Повысилась общая детализация и визуальная привлекательность арт-продукта
00:13:56
Создание различных ракурсов модели:
  • 1. Для улучшения качества результата решено использовать инструмент «Квен мульти результат», разработанный спикером
  • 2. Принято решение придерживаться размеров изображений 3 на 4 пикселя или пропорции 1 к 1
  • 3. Подготовлен специальный файл для загрузки изображений, подходящий под указанные параметры
00:16:37
Подготовка фотографий под разрешение модели:
  • 1. Необходимо избавиться от дефектов на фотографиях в виде непонятных татуировок
  • 2. Требуется подготовить фотографию с разрешением 1024×1024 пикселей
  • 3. Планируется использовать программу Adobe Photoshop для изменения разрешения изображений
00:17:39
Расширение и апскейлинг фотографий:
  • 1. Использован инструмент «Фил аутперформит» от компании Flux орк для расширения границ существующих фотографий
  • 2. Применён апскейлер CVAR (Cubic Video and Image Resizer) для восстановления качества изображений после увеличения кадра
  • 3. Получены удовлетворительные результаты обработки изображений, разрешение которых увеличено и восстановлено качество
00:19:50
Переименование и организация файлов:
  • 1. Разработана программа переименования файлов с ограничением количества файлов до 10 единиц за один запуск
  • 2. В настройках программы установлена фиксированная длина имени файла (2 символа)
  • 3. Выполнено последовательное переименование всех файлов согласно заданному шаблону
00:22:10
Задание промтов и подготовка датасета:
  • Разработан алгоритм автоматической генерации промтов для фотографий с помощью инструмента image кепч
  • Создан датасет изображений с разрешением 1024×1024 пикселей, предназначенный для обучения модели Lora
  • Обученная модель Lora размещена в закрытом Telegram-канале для участников проекта
0: В этом видео я покажу способ, как я собираю датасет той или иной внешности для дальнейшего обучения модели Лора. Этот способ применим как для сбора фотографий живого человека, да также для тех,
1: Случаев, где мы сгенерировали собственную модель в том или Ином инструменте, я буду использовать пример внешности, который я нашёл на пинтересте, перейду в pinterest, и тут мне приглянулась вот такая вот девочка я сохраню
2: Это изображение и все дальнейшие свои действия буду показывать именно на этом примере. После того, как я определился с внешностью, у меня есть мой собственный пайплайн, да, то есть последовательность действий, который в принципе приводит меня.
3: Всегда к удовлетворительным результатам при генерации, когда вот у меня уже Лора готова, я приступаю к тестированию и, в принципе, получаю нужные мне результаты. И 1, что необходимо, это избавиться от всего ненужного.
4: И выделить саму модель на 1 план. То есть основной, что тут не нужно сейчас в данном моменте. 1, это вот, вот эта шапка, аксессуары, да, следующее. Это вот этот телефон на переднем плане. Дальше.
5: Это вот эта звёздочка, также, это вот эти вот, наверное скорее всего, веснушки, которые бы я бы, скорее всего, убрал бы, можно все это сделать. Либо в inpatient кст, но я
6: Покажу путь меньшего сопротивления это использование определённых сервисов. И сейчас я покажу более простой и бесплатный. И в браузере я буду использовать такую языковую модель, как джимена. Сюда просто нужно перетащить
7: Картинку так просто перетащу и напишу, удали. Смартфон отправляю. В принципе сейчас он поймёт, что от него требуется. Подгрузит модель нано бана.
8: И при помощи неё удалит нам смартфон, закрытый telegram канал. Да, и вот, вот такой вот вариант мы получаем и все остальное в таком же ключе. То есть 1, мы сохраняем картинку, перетаскиваем её сюда же.
9: И пишем, удали шапку, либо найти. Вот и получаем неплохой референс, с которым дальше и будем работать. Все остальное.
10: В плане аксессуаров это можно убрать вручную в фотошопе, но в принципе можно также это сделать и тут же сохраню эту картинку, перетащу её сюда же и напишу. Удали все аксессуар.
11: Отправить вот такой вот результат. Это уже не есть. Хорошо, поэтому я перейду в фотошоп и сделаю все это вручную. В фотошопе есть такой прекрасный инструмент, как рему.
12: Я выбираю его и сейчас я удалю все ненужное, либо найти ссылку в описании. Итак, вот такую вот фотографию мы получаем дальше. Это нужно разнообразить ей цвет волос.
13: Придать какие-то другие причёски и в целом можно приступать к дальнейшим шагам после того, как я избавился от всего ненужного, у меня получилась вот такая вот фотография эту фотографию я загрузил также в jimmy i.
14: И создал там сперва изменил цвет волос, также создал другие причёски. Так, следующее, следующее. Это вот эти референсы нам нужно обсели ь. Поэтому
15: Я запущу они.
16: Итак, для апскейла я использую свой новый пакет, который ещё находится на стадии сборки, но уже сейчас тут присутствует такой рабочий процесс, как sit виар 2 версии. Я запущу рабочий процесс, сориентируюсь.
17: Тут есть несколько версий, и сейчас я каждый покажу так сориентируюсь на рабочем процессе. И 1, 1, это нам нужно прогрузить сам исходник. 2, вся генерация.
18: Ориентируется на частоту пикселей и на частоту Шумов. Тут есть заметки вот в 0 1 это максимальное качество шумы, допустим, 0 это отсутствие Шумов, чем ниже шумы.
19: Также тем лучше качество сейчас у меня стоит все на максимальном уровне, поэтому я просто запущу рендер и ещё что я хотел проговорить этот рабочий процесс я закину в свой telegram канал.
20: В который можно попасть, перейдя по вот этому QR-коду на мой бусти, где вы можете найти подробное описание итак запускает рабочий процесс при генерации модель загружает.
21: Автоматически, путём проб и ошибок я выделил для себя именно вот эту модель я нажимаю просто на генерацию и дожидаюсь самой генерации.
22: Итак.
23: Вот наша генерация, я приближу, чтоб можно было посмотреть её прям очень детально рассмотреть.
24: Да.
25: По мне, так это очень и очень неплохо.
26: Если ещё обращать, обратить внимание на вот эти микроволоски. Но да, это смотрится очень качественно, да.
27: Результат меня больше, чем устраивает. Так, ладно, следующий инструмент включу, инструмент по маске, загружу сюда же тот же референс и тут
28: Есть несколько настроек. Мы можем переключать маску в зависимости от того, что мы хотим про обский ить. Допустим, мы хотим обский ить только лицо. Для этого я выключаю все характерис.
29: Листики, такие как волосы, да, там тело, одежда, аксессуары, фон и генерация.
30: Итак.
31: Вот у нас получается генерация. И вот по маске можно обратить внимание на неё, что он выделил исключительно лицо, что мы в принципе и указали, и
32: Вот такое вот качество.
33: Да, это неплохо.
34: Это очень даже неплохо.
35: Вот, ну, можно пронаблюдать, да, что он проскейлил исключительно лицо, не тронув абсолютно ничего. Ну, только маску, если я включу волосы, тело и одежду, хотя её тут нет.
36: Да, вот. Ну, можно, в принципе, одежду выключить. Вот и генерация то, в принципе, он прогенератива эти аспекты, затрагивая всю маску.
37: Да вот наша масочка и в принципе,
38: Вот наш апскейл.
39: Наши губы.
40: Наши глаза, бровки, ну и волосы.
41: Да, да, так. Перейдём к следующему инструменту, я включу про версию тут в про версии она отличается лишь тем, то, что
42: Тут есть автоматическая контрастность, которая накидывается на саму генерацию. Также можно регулировать шум и также его размывать. Так я загружу сюда ту же самую картинку, да, нашу модель.
43: И в принципе, тут все стоит по на максимальном уровне, да, то есть высокий уровень частоты пикселей, а также там к минимуму, это, ну, ultra 0 0 1, это ultra
44: Минимум шума, так как у нас тут минимальный шум, я пока вот эти вот настройки, да, с добавлением шума, наоборот я их отключу. Для этого я зажимаю контрол, нажимаю на 1, на 2.
45: Да, все тоже самое.
46: Только если я сейчас включу для демонстрации, как работают шумы, я включу шумы. Плюс здесь тоже я выставлю, допустим, в 5, да, медиум. Вот.
47: И ещё 1 генерацию.
48: Итак.
49: Эти шумы, они влияют на само качество изображения. Чем больше Шумов, тем больше каких-то интересных деталей появляются в генерации, а также какой-то резкости. Поэтому весь
50: Этот процесс, он зависит исключительно от самого референсного изображения. То есть, допустим, вот в этом варианте тут можно пронаблюдать, что шумы, они как будто бы кожу сделали более более
51: Шумный, наверное, да, правильно, если сказать, да, более шумный. Вот, а также добавили каких-то второстепенных деталей.
52: Да, однозначно. Вот я вот вижу, тут вот пигменты прям можно увидеть на коже. Это за счёт этих именно Шумов. Также вот на губах появились такие белые пятнышки. Тоже пигментация именно этот эффект даёт вот именно вот эта настройка.
53: Который добавляет поверх ещё Шумов. Помимо того, который здесь уже присутствует. Так, следующее я верну все в минимальные шумы, отключу эти шумы и добавлю сюда.
54: Другую модель. Вот такая вот модель. Это генерация с прошлого выпуска. Посмотрим на неё. Так.
55: Генерация.
56: Так, я приближу и посмотрим более детально начнём со смартфона.
57: Ну вот логотип, конечно. Ну ладно, это вообще второстепенно.
58: Да, кольца выглядят естественно. Также вот кожа выглядит, естественно, ногти естественные.
59: Тут даже добавилась детализация вот к этой цепочке, да, золотой.
60: Также добавилась детализация в кружева, она более какая-то логичная стала, более естественная. Так, ну, волосы.
61: Тоже самое. Вот прям каждый волосок.
62: Да, да, мне это scale однозначно нравится. Однозначно. Ну и в принципе, глаза вот такие вот глаза можно пронаблюдать.
63: Да, и ещё 1 вариант так, сориентируюсь. Это вот такой вот исходник для тоже моего арта, который я создавал также в этой сборке. Так.
64: И генерация.
65: Да, да, неплохо.
66: Очень даже неплохо.
67: Добавилась такая текстура кожи накладывать на такую текстуру кожи какие-то там, да, имитировать татуировку это 1 удовольствие на самом деле.
68: Ну и по остальным каким-то вопросам тоже самое.
69: Да, более все стало детализированней, да.
70: Волосы. Ну да, да, однозначно. Мне это нравится. Так, после апскейла у меня получились вот такие вот варианты. Так, вот такая вот девочка.
71: Потом я оскели также с другими волосами, то есть каждый образ обский ится отдельно. Вот. И добавил ещё вариант с блондинкой. Следующее, что нужно нам нужно теперь задать ей.
72: Точнее, сгенерировать ей несколько разных ракурсов, да, для разнообразия. Я для этого использую свой инструмент квен мульти результат. И да, продолжу там в сборке я использую свой пакет.
73: Queen про открываю квен юнион, сориентируюсь на инструменте мульти, результат, сейчас я быстро все заполню и начну генерацию итак, я заполнил все необходимое.
74: И следующее. Мне нужно перекинуть сюда оселение, фотографию. Следующее. Тут у меня указано 3 на 4. Нужно следовать именно этим параметрам либо 3 на 4, либо 1 к 1. Так как
75: У меня уже подготовлено под 3, на 4. Я оставлю 3 на 4. Если ваши файлы не подходят под эти параметры, лучше изначально их подогнать. Обычно для таких задач я использую фотошоп, у меня фото.
76: Есть специальный файлик, который, в принципе, подходит именно под эти задачи. Я сюда закидываю, к примеру. Вот если я сейчас закину вот эту нашу работу 1
77: И расшири её. То есть в принципе видны границы, которые нужно заполнить. Получается, мне эту картинку нужно заполнить.
78: Вот так вот. То есть, чтоб кадр был весь заполнен, тогда генеративная модель будет работать намного эффективней, нежели бы она там, да, вот этот исходник был бы вот в таком разрешении, да, то есть сразу нужно подгонять под то разрешение, под которое рассчитано
79: Сама генеративная модель, я перейду в сборку и в принципе генерация.
80: Итак, на выходе я получаю вот такие вот генерации, и если приблизить их, то получаются вполне рабочие ракурсы. Дальше мне нужно также
81: Другими причёсками, вот выбрать там необходимые для датасета работы. И в принципе, да, как-то так по итогу у меня получились вот такие вот результаты, да, модель с разных ракурсов.
82: Тут ещё хочу отметить, что нужно избавляться от подобных вот дефектов, да, в виде каких-то непонятных татуировок. Следующее нужно подготовить фотографию под разрешение 1.
83: К 1, то есть 1024 на 1024. Это, конечно, можно сделать вот так в фотошопе закидываю свою работу, выбираю инструмент и вот я могу выбрать в принципе, разрешение 1 к 1.
84: В будущем 1024 на 1024. Если я сейчас её кропнул, то какая-то часть информации просто отсутствует, а я стараюсь делать свои исходники сб.
85: Информации для модели. То есть мне, по сути нужно дополнить недостающее. Для этого я возвращаюсь в конфи юай, запускаю свой пакет, флакс про открываю.
86: Flux орк и тут во flux орк есть такой инструмент как Фил аутперформит и расширяет границы уже имеющихся фотографий. Загружаю сюда нашу генерацию.
87: Выставляю разрешение в левую часть 100 и вправо 100.
88: И генерация.
89: Да, вот я получаю соотношение 1 к 1 с заполненными нашими границами. Да, следующее я проделаю все тоже самое с другими, к примеру, загружу ещё 1 вот, вот эту генера.
90: Да, итак, вот получается заполненная область и таким образом, модель, которая будет обучаться на моих фотографиях, она, в принципе, у неё точнее будет больше информа.
91: Информации о моей модели. И так как при расширении, да, нашего кадра мы потеряли качество, то его нужно вернуть. Делается это все теми же самыми способами. Мы
92: Открываем апскейлер сит виар. 2 версии, закидываем каждую генерацию, которую мы расширили и в принципе, производим апскейл. Я уже проделал эти манипуляции и в принципе у меня получились
93: Такие результаты, которые меня полностью удовлетворяют.
94: Да.
95: Это вполне достаточно для того, чтобы получить, к примеру, сейчас вот эта генерация, у неё разрешение 2060.
96: 4 на 2064, а нам нужно разрешение 1024 на 1024. Поэтому при уменьшении этого разрешения, в принципе, насыщенность нашей картинки, там качество, да, там цвета
97: Она, в принципе, не сильно пострадает, поэтому такой вариант вполне приемлем. И следующее это я все эти генерации сейчас переименую. Для этого я запущу вот эту программу назва.
98: Можно понаблюдать вот тут дальше следующее, так как у меня версия без моей учётной записи, поэтому мне будет доступно всего лишь 10 файлов на переименование я выделю 10.
99: Файлов. Перетащу их в программу.
100: Зайду в настройки, фиксированная длина числа выставлю на 2 позиция номера на конец, и сюда я вобью новое имя.
101: Так назвал я её сенди сенди. Нижнее подчёркивание. И, в принципе, вот наши номерки нажимаю на применить окей. И вот у нас список переименовался. Следующее.
102: Я беру ещё 10 фотографий, так здесь я удаляю, а эти я перетащу.
103: Дальше тут нужно начальный номер изменить на 11, так как у нас последняя цифра это десятка, я нажимаю переименовать окей. И в принципе, у нас вот 10.
104: 11 также удаляю все файлы раз и выбираю следующие. Перетащу наш 3 десяток. Тут, так как у нас двадцатка, тут я выставлю 21.
105: Переименовать. Окей. И получается все, да, все верно. Так удалить и остались у нас 4 варианта. Тут я вобью, так как у нас 30 это
106: Последняя 31. Применить. Окей. И в принципе, все вот наши все фотографии переименовались в нужной нам последовательности. Отлично. Следующее это нужно.
107: Каждой фотографии задать промт, чтобы не делать это вручную я буду использовать свой инструмент image кепчик для этого я перехожу в сборку.
108: Итак, захожу в пакет, другие имидж, кепчик, сориентируюсь на рабочем пространстве, выключу 1 инструмент и включу 2 сюда. Сейчас необходимо вставить ссылку.
109: То to ссылку, в котором находится наш датасет. Для этого я
110: Скопирую ссылку нашей папки.
111: Вставлю вот сюда и генерация. После завершения генерации я пройду в папку, и тут можно обратить внимание, что под каждой генерацией образовался вот такой вот текстовой документ.
112: В виде промта, в принципе, этот текстовой документ, он описывает ту или иную внешность, то есть под каждую да, генерацию прям подробный промт.
113: Который, в принципе, нам и нужен. Да, все верно. Следующее, как я и упоминал ранее, у нас генерация сейчас составляет
114: 2064 пикселя на 2064 пикселя. Нам нужно урезать это draw 1024. Для этого я сейчас выделю все эти генерации и следующее. Мне нужно все эти файлы.
115: Закинуть в такой сервис, как брайм брайм выглядит вот так. Я перетащу все файлики в правой части. Мы можем пронаблюдать разрешение, соотношение, да, нашей картинки.
116: И, в принципе, тут у меня стоит все верно. Просто сейчас у неё изначальное разрешение. Это вот, как я говорил ранее, 2064 по каждой стороне, поэтому мы сейчас его это все урежем и да.
117: Я скачаю zip архив итак, вот такой вот архив мы получаем по итогу, который содержит в себе разрешение 1024 по каждой стороне, теперь нам нужно разархивировать этот архив в нашу папку.
118: В принципе, вот эти вот генерации с разрешением 2064 по каждой стороне нам нужно отсюда изъять. Итак, я создам новую папку. 2064.
119: Зайду в неё и перемещу все генерации в эту папку переместить. Итак, все наши файлы с разрешением 2064 перемещены теперь из
120: Вот этого архива мне нужно переместить вот в эту папку. Сейчас я все это разархивирую. Так, после разархивации, в принципе, тут все по своим номеркам, каждый промт принадлежит своей картинке и в принципе все
121: Верно. Если проверим, то в принципе получаем 1024 на 1024. Это идеальный вариант. И если мы сейчас посмотрим на качество изображения, то
122: Наблюдаем, насколько оно высокое. Да, этот датасет, в принципе, очень и очень хорош для того, чтобы обучить качественную модель на вот, вот этой внешности. Ну, то есть модель Лора, да, следующий
123: Мы берём этот датасет, закидываем либо загружаем в тот инструмент, где мы обучаем лору и обучаем нашу Лора. Итак, у меня получились вот такие вот генерации, да?
124: При помощи моей Лора, которую я обучил на базе вот именно того датасета, который я показал в этом ролике, эту лору я закину в свой закрытый telegram канал, также я опубликую рабочий процесс.
125: Апскейла си виар 2 версии чтобы получить доступ в закрытый telegram канал, нужно либо отсканировать вот этот QR-код, либо найти ссылку в описании этого ролика также хочу напомнить о своём telegram.
126: Информационного характера, куда я публикую все новости проекта, они