анонс: локальная модель для картинок

хей, парни и девчонки, у меня разъёбная новость:

готовлю интеграцию локальных моделей для генерации картинок, будет (пусть и с небольшими оговорками) то что многие хотели бы видеть и ваш "покорный" слуга планировал изначально (но руки дошли только сейчас): автоматическая генерация визуала, можно сказать что почти всё комбо - текст, картинки, речь будет собрано

на иммерсивность все три составляющие работают, как мне кажется - шикарно, не хватает видео :): но сразу про оговорки:

→ на ноутбучной nvidia 4070 картинка 1152*640 с 27 шагами генерится ~27-35 сек, это пожалуй главный минус, на декстопной будет ~14-16 сек. на cpu всё печально, думаю > пары минут

кнечно можно будет поменять разрешение, поиграться с кол-ом шагов, чтобы добиться большей скорости без сильной потери в кач-ве

→ с моделью claude есть проблемы с цензурой для автоматической генерации промтов картинок, но надеюсь в конечном итоге получится её обойти

→ модель весит 6.7gb, win-local версия вырастет до 17.5gb (но это думаю так себе беда, качается один раз, потом можно обновляться без встроенных локалок)

выбор пал на модель iLustMix - это sdxl stable diffusion, был вариант интегрировать чрз уже привычный koboldcpp, но отмёл потому что запросы с текстовой модели конкурировали с моделью картинок, ну и мне показалось родное решение от stable diffusion правильней

основная работа уже проведена, но в этот раз хочется выпустить максимально релизную версию без багов и чтобы новый функционал сходу давал бы всё необходимое поэтому скорее всего к следующей пятнице

если ты уже собаку съел на моделях sdxl - пиши рекомендации в личку и комменты

ах да, и пруфы-примеры того что пока получается, это без какой-либо обработки, как есть:

announcement

local model

images

stable diffusion

ilustmix

RvGVV

Модели на сд можно самому свои ставить? Баловался недавно сам таким контентом

Jun 21 2025 17:17

Multiic

RvGVV, да, постараюсь на старте добавить по аналогии с текстовыми

Jun 21 2025 19:57

VvV

а можно добавить для Фионы и других мадлеей .арты беремености ?

Jun 21 2025 19:08

MultiicReplying to VvV

VvV, видео гайд - типо инструкцию, на что? для модели картинок думаю инструкция не понадобится по крайней мере для включённой в билд модели

Jun 22 2025 20:27

VvVReplying to Multiic

Multiic, на то как устоновить озвучку.как подлючить дригие модели

Jun 23 2025 21:41

XAMELION

Claude, в моем личном рейтинге, выдает самый лучший результат, но как будто 4й по сравнению с 3.7 реально стал больше цензурировать. Надеюсь, что удастся обойти ограничение на промт.
А нельзя именно генерацию промта оставить за локальной моделью? Это вроде не сложная задача и с ней даже слабые модели должны справляться. Если уже используется одна локальную модель для картинок, то игра уже становится тяжелой и добавление еще одной модели для генерации промта под нее как будто выглядит неплохим решением.

Jun 22 2025 01:12

Multiic

XAMELION, генерация промта будет за той моделью которая используется. слабые локальные модели плохо справляются - довольно сложная для них инструкция, но если с клодом не получится - подумаю над тем чтобы на локалку переложить

Jun 22 2025 21:43

Multiic

Showcase

анонс: локальная модель для картинок

base

person

visionary

absolute