Дмитрий Невский

Дмитрий Невский 

О нейросетях - просто, заходи

1 074subscribers

153posts

Showcase

7

Оптимальные разрешения для Stable Diffusion (1.5, SDXL, Flux, Flux Kontext) - Шпаргалка

Всем привет 👋 Сегодня на повестке один из самых часто задаваемых вопросов - какое разрешение и для каких моделей лучше использовать при генерациях картинок, и почему?
Наверное вы уже слышали, что модели для генерации изображений, например модели Stable Diffusion работают лучше всего с определёнными разрешениями и неправильный выбор может привести к артефактам, искажениям или ошибкам. Давайте разбираться)

1. STABLE DIFFUSION 1.5 - одна из самых популярных моделей для генерации изображений. Для этой модели рекомендуются следующие разрешения:
512×512, 512×768, 768×512 (но не больше 1024×1024). Почему?
- Обучалась на изображениях 512×512, из-за чего эти модели больше всех имеют проблемы с глазами и пальцами. 
- При больших размерах появляются дублирующиеся объекты, повторяющиеся части тел или растягивающиеся конечности, что в последствии успешно фиксилось расширением Kohya HRFix.
- Делимость на 64, важна для архитектуры UNet.

Итак, здесь все просто, примеры рабочих разрешений:
✅ 512×512 (1:1)
✅ 512×768 (2:3)
✅ 768×512 (3:2)
❌ 256×256
❌ 600×600 (не делится на 64)
❌ 1024×1024 (может давать артефакты)
Как влияет?
- Слишком маленькое (256×256) - потеря деталей.
- Слишком большое (1024×1024+) - задвоение предметов, растяжение конечностей. Что бы вы понимали почему так происходит - механизм внимания модели рассчитывается в соответствии с размерами изображения на котором ее обучали, поэтому при большем размере она пытается заполнить пустое пространство создавая копии объекта.
Но даже если размер не делится например на 64 - это не значит, что картинка не будет генерироваться, возможно при использовании некоторых расширений интерфейс скорее всего будет выдавать ошибку.
2. SDXL (1024px база)
Оптимальное разрешение: 1024×1024, 768×1024, 1024×768.Почему?
- Обучалась на 1024×1024, но поддерживает прямоугольные форматы.
- Делимость на 128 (лучше всего). 
Максимальные рекомендуемые размеры при генерации - 1.5–2 МП (иначе возможны ошибки, артефакты и пр.). Однако даже при увеличении разрешения до 2048 по большей стороне во зможны искажения анатомии и деформация предметов, что так же успешно фиксится -  Kohya HRFix.
Тут надо уточнить что имеются ввиду генерации без апскейла. При апскейле или использовании Hires. fix (не путать с Kohya HRFix) с размером например - 768×1024 и увеличением в 3 / 4  раза - искажений не будет. Возможны конечно задвоения с апскейлом в img2img при высоком Denoising strength, но это другая история.
Примеры рабочих разрешений:
✅ 1024×1024 (1:1)
✅ 768×1024 (3:4)
✅ 1024×768 (4:3)
✅ 768×1152 (2:3)
✅ 768×1280 (9:16)
✅ 1152×768 (3:2)
✅ 1280×768 (16:9)
✅ 1536×640 (21:9)
❌ 1080×1080 (превышает 1.5 МП)
❌ 512×512 (слишком мало для SDXL)
❌ 1600×900 (не всегда, но могут появляться артефакты)

Конечно, можно использовать и другие размеры, главное что бы меньшая из сторон не превышала 1.5 МП, а большая 2 МП (2048)
Как влияет?
- Идеальное разрешение под 1024px - максимальная детализация.
- Прямоугольные (768×1024) - лучше для портретов/пейзажей.
- Свыше 2048px возможны фризы и зависания, а так же задвоения предметов.
- Слишком маленькое разрешение 512×512 или 512×768 приведет к замыливанию и дефектам.  
3. FLUX 1. DEV / SCHNELL (особые требования). Модель Flux была разработана немецкой компанией Black Forest Labs (BFL), основанной в 2024 году бывшими сотрудниками Stability AI. Семейство моделей FLUX на сегодняшний день включает в себя - Flux.1 и FLUX Kontext, которые делятся на варианты Schnell (только Flux.1) , Dev, Pro и Ultra, из которых нам пока доступны только Schnell и Dev. 
Для оптимальной работы моделей Flux рекомендуется использовать - не больше 1.6 МП, иначе возможны артефакты в виде полос и сеточек. Некоторые расширения (Flux Tools например) могут выдавать ошибку - "mat1 and mat2 shapes cannot be multiplied", если разрешение картинки не делиться на 64.
✅ 896x1152 (8:10)
✅ 1024x1024 (1:1)
✅ 1024x1280 (4:5)
✅ 1280x960 (4:3)
✅ 1536x1024 (3:2)
✅ 1600x896 (25:14)
✅ 1664×1216 (4:3)
✅ 1920x1024 (5:3)
✅ 2176×960 (21:9)
❌ 256x256 (1:1)
❌ 512x512 (1:1)
❌ 512x768 (2:3) 
Однако в отличии от предыдущих моделей, Flux может поддерживать более широкий диапазон разрешений от 0.2 до 1.6 мегапикселей и демонстрировать хорошие результаты с размерами близкими к рекомендуемым, например:
✅ 674x1462 (9:19.5) - типичное соотношение для экранов смартфонов, таких как iPhone;
✅ 768x1360 (3:5) - формат, используемый для соц.сетей и мобильных устройств;
✅ 1080x1920 (9:16) - распространенное соотношение сторон для смартфонов и обоев.
Но при этом изображения с разрешением 512 x 512 в целом получаются менее детализированными, даже с учётом меньшего количества пикселей.
FLUX.1 DEV KONTEXT - по умолчанию создает изображения размером 1024x1024 пикселя. Это стандартное разрешение обеспечивает высокое качество при оптимальной скорости генерации. Рекомендуется использовать разрешения до 1 мегапикселя.
Поддерживаемый диапазон соотношений:
От 3:7 (портретная ориентация) пример - 640x1472
До 7:3 (альбомная ориентация) пример - 1408x608
Популярные соотношения сторон:
✅ 1024x1024 (1:1)
✅ 1152x640 (16:9)
✅ 1152x640 (9:16)
✅ 896x1152 (3:4)
✅ 1152x896 (4:3)
❗❗ Важные ограничения:
- Рекомендованный размер всех выходных изображений должен иметь общее разрешение около 1 мегапикселя.
- Входные изображения: поддерживаются изображения размером до 20 МБ или 20 мегапикселей для редактирования.
- Качество исходного изображения: для файнтюнинга (обучения моделей) рекомендуется использовать изображения высокого качества, но их размер не должен превышать 1 Мп.
Эта информация основана на документации  из официальных источников - Stability AI, а так же компании BFL (Black Forest Labs) по моделям FLUX.1 DEV, FLUX Kontext и другим моделям FLUX, которая содержится в руководствах по созданию и редактированию изображениям:
Stability AI — документация по SDXL
Hugging Face: Stable Diffusion Models
High-Resolution Image Synthesis with Latent Diffusion Models
Introducing FLUX1.1 [pro] Ultra and Raw Modes
FLUX.1 Pro Ultra In-Depth Look: 4MP Resolution & Raw Mode!
FLUX Image Generation with DigitalOcean
BFL Documentation
Всем спасибо за прочтение, надеюсь эта информация  будет для вас полезной, вопросы как всегда пишите в комментариях 👇 Всем хорошего дня и удачных генераций ✌😉
ЗЫ: Чуть не забыл, у меня теперь в Вк есть канал, теперь все новости пишу там, подписывайтесь)
Я в основном 832*1248 юзаю для flux и SDXL. Косячят примерно так же как и с 1024*1024beaming_face
Константин Сломецкий, попробуй на sdxl - 1024x1536, тут сразу заметишь)
Дмитрий Невский, пробовал, знаю beaming_face
Ещё где то в прошлом вычитал что кратность 64ём важна. Так и калькулирую в случае чего.
Спасибо! Очень полезная информация. Часть вопросов сразу отпалаparty_popper
Aliya Ojoko, ура 🎉🎉🎉
Дима, стоило бы еще упомянуть расширения Forge кoторые задают правильные ratio.
Stas Gordon, возможно, опять же расширения нужно настраивать, а это уже другая история... 
Просто не знаю где можно спросить - перестал работать SD после переустановки Win10. Как отрезало....
Georg, бывает) что бы вам помочь нужно хотя бы знать вводные данные, что за сд, как устанавливался, скриншоты с ошибками и пр.
Здравствуйте. У меня стояла
webui_forge_cu124_torch 24 и ранее предыдущая версия 121. Крах случился после обновления Win10. Обновление прошло неудачно. Я делал откат. И думаю, что обе версии были сломаны через обновления ОС. Сейчас Win10 Home, 22H2, на днях перехожу на Win11 PRO. Имею RTX3060, (она исправна) ОЗУ32ГБ.
И да, теперь не устанавливается ни одна версияSD. Только на старой версии Win10 torch 21, но там защитник блокирует питон, ошибка 997. Вот такие дела. ((
Georg, Если вы переходите на Windows 11 Pro, установите драйвер NVIDIA вручную с сайта - «Studio Driver» , а не «Game Ready», он стабильнее работает с CUDA и Torch-библиотеками, заново скачайте Forge c официального репозитория, ту сборку которую рекомендуют на сайте, должна запуститься
У меня стоит именно Studio Driver, хотя ранее была игровая и также было норм. работала, не в этом дело. Я тут у вас думал новую сборку Forge приобрести. Но вот теперь даже и не знаю, что делать. Видимо что-то серьёзное у меня случилось.
Большое спасибо Дмитрий. Я полностью решил проблему, ну или почти полностью. Вам спасибо за участие, эти посты я бы просто удалил, чтобы не засорять ветку. 
Georg, не нужно, может быть они кому то помогут)
Subscription levels3

⭐️ НОВИЧОК ⭐️

$0.71 per month
✨ От нуля к первой картинке: просто, ясно, красиво

⭐️ СПАСИБО ⭐️

$1.41 per month
⭐ Если вам нравятся мои посты и всё, что я делаю, то можете сказать "спасибо", оформив эту подписку. Для вас это мелочь, а мне приятно))
-------------------------------------
⭐ Подборки промптов + посты доступные для новичков

⭐ ЭНТУЗИАСТ ⭐

$5 per month
⭐ Присоединяйтесь ко мне в моих творческих начинаниях и помогайте воплощать мои идеи в жизнь.
⭐ Полезные гайды, лайфхаки и мои эксперименты с нейросетями, разные интересные находки.
⭐ Авторские стили и промты, лоры и модели а так же настроенные сборки Forge / A1111 и многое другое.
Go up