Владимир Жданкин

Владимир Жданкин 

Раньше занимался фотографией-теперь учу нейросеть.

24subscribers

33posts

goals1
$0 of $8 498 raised
Собрать деньги на серьезный второй комп под обучение нейросетей на основе ожидаемой к НГ новой видеокарты 5090.

About

Раньше серьезно занимался фотографией, в частности, детской. Именно эта тематика привлекала меня больше всего, и я даже добился неплохих результатов, участвуя в фотоконкурсах и фотовыставках. Особое внимание уделял чёрно-белой ручной печати, которая, по моему мнению, передаёт особую атмосферу и настроение.
На данный момент мои интересы сместились в сторону обучения нейросетей. Как бывший детский фотограф, я решил попробовать обучить нейросеть (SDXL) на детство, в частности, на тематику "Советское детство". Этот выбор обусловлен не только моими личными воспоминаниями, но и желанием сохранить и передать следующим поколениям уникальную атмосферу того времени.
Цель создания канала - найти единомышленников и помощников для работы над проектом "Советское детство". Подготовка данных для обучения нейросети - это сложная и хлопотная работа, которая требует много времени и усилий. Например, нужно найти кадры из советских фильмов, довести их до ума и добавить описания к ним.
На канале не предполагается платный контекст, но я буду рад любой помощи. Если вы готовы внести свой вклад в развитие проекта, я буду рад вам!
Ваше участие может заключаться как в добровольных пожертвованиях, но лучше в виде помощи в подготовке данных, создании новых изображений, правке описаний и многом другом.
Важно! Я хоть обучением SD заниматься с конца весны 2023г - но мой опыт это практические эксперименты сложного обучения с очень слабой теорией -мало того что сложное обучение изначально = алхимия -так и мой подход -это полная алхимия!
Я буду рад, если к нам присоединятся единомышленники и люди, которые могут дать полезные советы.
Но я не готов отвечать на кучу примитивных вопросов людей, которым лень пользоваться гуглом!!!!!!

Попаданец в СССР - игра для ИИ

Как насчет поиграть с ИИ в классические текстовые квесты (Text Adventures) - причем на популярную тематику попаданцев в СССР?
На которую есть куча книг, но нет игр вообще.
---------
Как начать - закинуть например ИИ в новый чат текстовой прикрепленный промпт (можно в виде файла) и попросить изучить этот файл.
md
Проект Красный Шанс.md5.98 Kb
«Проект: Красный Шанс» - сырой конечно -требует доводки и например адаптации под игрока -но как оказалось вполне играбельно.
----
Предыстория:
Просто ради эксперимента закинул в Qwen-MAX:
Мне попался интересный рассказ -там упоминается о старом жанре компьютерных игр -вот фрагмент того рассказа:
[...]
Ну а пока есть время удивляться, популярности одного хитрого игрового жанра, текстовых адвентюр. Во времена 3д графики, полигональных монстров - про такое совсем забыли. А ведь это была целая история, множество игр с огромной популярностью. Как их описать вкратце - интерактивные книги. Игра в литературной форме описывает текущую ситуацию, а игрок текстом пишет в командной строке дальнейшие свои действия. Например начало одной отличной игры этого жанра 'Вы, злобный шпиен, выброшенный с парашютом к хитрому врагу. Но увы, теперь болтаетесь на стропах, купол зацепился за ветки. Чо делать?'. Правильное начало 'уцепится за ближайшую ветку, достать тесак, отрезать стропы'. Кажется можно идти дальше... какое-то время, пока не поймают. Потому что настоящий диверсант никогда не забудет дать команду 'забраться на дерево, снять остатки купола и заныкать их, шоб враги не нашли!' Вообщем, в таком аспекте.
Игр такого класса написано множество, весьма головоломных и просто развлекательных, иногда даже стебных. Объединяет их одно - практически полное отсутствие графики, скупые картинки локаций это уже достижение, и серьезные требования к интеллекту играющих."

Мой новый рабочий мерж - SDXL.


XL_MY-MERGE-model-v03.safetensors
rar
XL_MY-MERGE-model-v03.part1.rar900 Mb
rar
XL_MY-MERGE-model-v03.part2.rar900 Mb
rar
XL_MY-MERGE-model-v03.part3.rar900 Mb
rar
XL_MY-MERGE-model-v03.part4.rar900 Mb
rar
XL_MY-MERGE-model-v03.part5.rar900 Mb
rar
XL_MY-MERGE-model-v03.part6.rar900 Mb
rar
XL_MY-MERGE-model-v03.part7.rar863.44 Mb
Решил выложить свой новый рабочий мерж.
Попробуйте на этом мерже старые лоры! или смержить с ним свои любимые старые модели.
На сивитай смысла вкладывать нет - так как это довольно простой мерж исключительно чужих моделей.
При выборе моделей акцент делал на широкий охват тематик которые знает модель - но некоторые модели вмержил для улучшения генерации людей включая обнаженку.
Но на мой взгляд модель получилась хорошая - универсальная, дает довольно качественные генерации.
Всякие аниме не тестил - тестил в основном советскую тематику и качество на фотореализме.
Но учитывая что в нее входят универсальные модели которые могут как реалистичную обнаженку так и аниме -думаю все в ней присутствует.
И еще очень приятный момент - она по умолчанию генерит европейцев.

Z_Image_Lora_Soviet_GAZ21_22_v002

Z_Image_Lora_Soviet_GAZ21_22_v002
Эта тестовая LoRA! Разработчики модели Z-Image-Turbo указали что языки модели - китайский и английский. Но ее тестовой энкодер qwen 3 отлично знает русский язык! и в итоге модель Z-Image-Turbo хорошо понимает запросы на русском языке!
Эта лора задумана как тест обучения на русском языке. Датасет 150 фото разных размеров и соотношений сторон и все их подробные описания на русском языке! Все описания создавались на русском языке на модели qwen 3VL 8B и редактировались в ручную. LoRA обучена в AI-Toolkit с использованием оптимитизатора prodigy-plus-schedule-free на модели Z-Image-Turbo с использованием zimage_turbo_training_adapter_v2.safetensors Обучение длилось 30 000 шагов, по итогу тестов была выбрана эпоха которая отучилась около 27 000 шагов. LoRa обучалась на советские автомобили ГАЗ-21 и немного ГАЗ-22 так же в датасете были единичные фото с другими объектами которая лора запомнила - но очень плохо ГАЗ-М20, ГАЗ-51, Москвич-408, автобус ЛАЗ и советские троллейбусы и даже самолет ТУ-134. А вот советское окружение и типажи людей и их одежду изначальная модель более менее знала + хорошо дополнила знания из обучения. Основные теги для генераций "Советская эпоха, 1960е годы, ГАЗ-21, ГАЗ-22" эти запросы теги желательно так и использовать на русском, а вот подробное описание уже можно делать на другом языке который хорошо знает модель. Пример такого запроса:

Фотки снятые шириком в датасетах.....

Не так уж и редко бывает что на генерациях с людьми искажает пропорции людей как при съемке широкоугольным объективом - причем в запросе про ширик не упоминается.
Причина в том что народ пихает в датасеты что попало (да и не на всех фото эти искажения бросаются в глаза - но они есть) и не описывает особенности съемки в описании к фото в датсете.
Модели для создания описаний редко могут распознать ширик и его искажения и как правило ни как это не прописывают в описаниях.
А таких фото в инете море - фотографы очень любят уродовать людей шириками.... и эти фото идут в датасеты....
Для примера пару ярких примеров фоток из инета-перспективных искажений широкоугольной оптики на людях и на подобном тоже обучают....

Видео 30сек из 6 кусочков по 5 сек.

Видео 30сек из 6 кусочков по 5 сек.
wan2.2_image2video_14B - запросы на КИТАЙСКОМ (в этой нейронке ее родной язык работает лучше) - сочинял perplexity_ai.
Единственно на фрагменте где корова должна отряхиваться -как то неубедительно она это делает -хотя хрен его знает как коровы отряхиваются - явно не как кошки или собаки.
Так ты делал локально в Комфи?
Claus Celterman, Я по фото и обучению -а видео так разок поиграться.

Фотосессия с мукой...

Живу в сельской местности - с гимнастками тут тяжело.
Поэтому приходиться практиковаться на...

Немного троллинга фотографов. 🤣


"Если на фотографию мысленно добавить пару спаривающихся медведей, и она от этого выиграет — то это плохая фотография. А если спаривающиеся медведи окажутся лишними — то это хорошая фотография." (с) ??? предположительно Юрий Косин.
Но с появлением нейросетей - ваши шедевры могут стать лучше. 🤣

Мой рабочий мерж - SDXL.

Решил выложить свой рабочий мерж.
На сивитай смысла вкладывать нет - так как это довольно простой мерж исключительно чужих моделей.
Но на мой взгляд модель получилась хорошая - универсальная, дает качественные генерации и отлично обучается.
Всякие аниме не тестил - тестил в основном советскую тематику и качество на фотореализме.
Но учитывая что в нее входят универсальные модели которые могут как реалистичную обнаженку так и аниме -думаю все в ней присутствует.
И еще очень приятный момент - она по умолчанию генерит европейцев.
Уже не помню - в мерж вроде входит три модели:
albedobaseXL_v31Large
Жуткий мерж всего нормального что есть под SDXL - знает дофига чего -но генерит средненько.
theAramintaExperiment_fv5
Качественные генерации ориентирована в основном на обнаженку.
и вроде - agxl_V2
????
rar
XL_MY-MERGE-model.part1.rar900 Mb
rar
XL_MY-MERGE-model.part2.rar900 Mb
rar
XL_MY-MERGE-model.part3.rar900 Mb
rar
XL_MY-MERGE-model.part4.rar900 Mb
rar
XL_MY-MERGE-model.part5.rar900 Mb
rar
XL_MY-MERGE-model.part6.rar900 Mb
rar
XL_MY-MERGE-model.part7.rar724.51 Mb

Soviet futurism, bus.

Все изучаю свою модель: 
xl-soviet-union-v1-finetuned
- чего оно могет.
Как и ожидалось хорошо придумывает новые дизайны даже если запустить один запрос, но на случайных сидах - выдает хорошее разнообразие вариантов.
А ноги хорошей вариативности насколько понимаю растут из больших датасетов.
На картинках несколько разные варианты запросов - но на каждом варианте запроса по несколько разных картинок.
Ретрофутуризм. Очень неплохо. Но под конец всё стало немного слишком мультяшным, первая половина сета мне больше нравится.
Oleg Afonin, Вот у меня на ТГ канале -показательный пример на чем обучается....
Там кстати и картинок больше и процесс обучения почти в реальном времени освещал. 
Subscription levels0
No subscription levels
Go up