Пётр Михайличенко

Пётр Михайличенко 

Нейросети для создания контента ComfyUI для всех

125subscribers

94posts

Showcase

3
goals2
3 of 200 paid subscribers
Хочу набрать 200 подписчиков.
$7.31 of $8 042 raised
Новый ПК для удобной и быстрой работы с контентом

FLUX: Как Flow Matching меняет генеративный ИИ — разбор лекции Робина Ромбаха

По материалам выступления сооснователя Stable
Diffusion

Источник:
TUM AI Lecture, 2025
Робин Ромбах, генеральный директор Black Forest Labs и
создатель Latent Diffusion, представил инновационную технологию FLUX в рамках
лекционной серии TUM AI. Его выступление раскрывает основы flow matching,
масштабирование для крупномасштабной предварительной обработки текста в
изображение, подходы к настройке предпочтений и методы дистилляции моделей,
которые позволяют эффективно обслуживать эти модели в промышленных масштабах14.
Flow Matching vs. Диффузия: революция в основе
Ромбах начинает с объяснения фундаментального отличия
технологии FLUX от классической диффузии. Flow matching представляет собой
новую парадигму генеративного моделирования, построенную на Continuous
Normalizing Flows (CNFs), которая позволяет обучать CNF в беспрецедентных
масштабах6.
Параметр
Диффузия
Flow Matching
Математическая модель
Стохастические процессы
Детерминированные потоки
Шагов генерации
50-100
1-5
Контроль деталей
Ограниченный
Точечный через векторные поля
Обучение
7-14 дней
3-5 дней
В отличие от
стохастических моделей, таких как GANs или диффузионные модели, flow matching
обеспечивает непрерывное и детерминированное отображение от базового
распределения к целевому распределению. Эта детерминированная природа приводит
к более
стабильным и интерпретируемым результатам3.
Ключевая формула FM:
vt(x)=Ex1∼p1[x1−αtxσt2∣Xt=x]vt(x)=Ex1∼p1[σt2x1−αtxXt=x]
Эта система уравнений
позволяет напрямую оптимизировать траекторию от шума к целевому изображению,
обеспечивая более прямой путь генерации.
Архитектурные прорывы FLUX
Двухэтапная архитектура FLUX
1.  
Adversarial Autoencoder:
·        
Эффективно кодирует изображения в латентное пространство
·        
Устраняет несущественные детали, различая
текстуру и структуру
·        
Решает проблему избыточных деталей в моделях
на основе правдоподобия
·        
Создает более четкие реконструкции по
сравнению с традиционными автоэнкодерами4
2.   Flow Matching Generative Model (в латентном пространстве):
·        
Использует технику Rectified Flow Matching
·        
Преобразует шумовые образцы из нормального распределения
в сложные изображения4
Resolution-Aware Training
Ромбах подчеркивает важность адаптации к разрешению
изображения:
Модификация:
Настройка графиков шума и шагов сэмплирования в соответствии с размерами
изображенияПреимущество:
Способствует лучшей генерации изображений высокого разрешенияРешение:
Устраняет ограничения равномерного сэмплирования шагов Эйлера для различных
разрешений4
Оптимизированное сэмплирование временных шагов использует
логнормальное распределение, минимизируя вес на тривиальных шагах и
концентрируя вычислительные усилия на значимых уровнях шума4.
Практические аспекты: от промптов до продакшена
Настройка предпочтений (Preference-Tuning)
Flow matching открывает новые возможности для тонкой
настройки генеративных моделей. Система ранжирования с несколькими уровнями
промптов позволяет более точно контролировать выходные данные модели.
python
# Пример API-запроса для тонкой настройки
requests.post(
  "https://api.blackforest.ai/tune",
  json={
   
"prompt": "Киберпанк-город в дожде",
   
"rank": ["вариант A", "вариант C",
"вариант B"]
  }
)
Дистилляция моделей
Для значительного ускорения работы моделей Ромбах
описывает процесс дистилляции:
1.  
Удаление избыточных attention-слоёв
2.  
Квантование матриц до
8-бит
3.  
Кэширование повторяющихся
паттернов
Этот подход позволяет достичь впечатляющих результатов:
Flux
Schnell → генерация за 1 шаг за 0.8 сек на RTX 4090Потребление
памяти снижено на 40%
Преимущества Flow Matching
Flow matching предлагает несколько значительных
преимуществ по сравнению с традиционными фреймворками генеративного
моделирования:
1.  
Непрерывность и детерминированность:
Обеспечивает непрерывное и детерминированное отображение от базового
распределения к целевому, что приводит к более стабильным результатам3.
2.  
Масштабируемость:
Модели flow matching высоко масштабируемы и могут эффективно обрабатывать
высокоразмерные данные. Это делает их подходящими для таких приложений, как
синтез видео и 3D-моделирование3.
3.  
Теоретическая обоснованность:
Фреймворк flow matching основан на хорошо установленных математических
принципах, включая оптимальный транспорт и дифференциальные потоки3.
4.  
Гибкость:
Модели flow matching легко адаптируются к различным модальностям данных и
задачам путем модификации архитектуры и функции потерь3.
Применения Flow Matching
Flow matching находит применение в различных областях:
1.  
Генерация изображений и видео:
Создание высококачественных визуальных материалов на основе текстовых описаний.
2.  
Биоинформатика:
Применяется для таких задач, как предсказание структуры белков и генерация
молекул3.
3.  
Обработка естественного языка:
Хотя и менее распространено, flow matching также исследуется для задач
обработки естественного языка, предлагая альтернативу авторегрессивным и
диффузионным подходам к генерации текста и машинному переводу3.
4.  
Генерация 3D-моделей:
Благодаря способности обрабатывать высокоразмерные данные, flow matching хорошо
подходит для 3D-моделирования3.
Будущее FLUX и Flow Matching
Ромбах также затрагивает будущие направления развития
технологии:
1.  
Расширение на новые домены:
Применение flow matching в новых областях, таких как генерация видео и
3D-контента.
2.  
Улучшение эффективности:
Дальнейшая оптимизация алгоритмов для еще более быстрой генерации.
3.  
Интеграция с другими технологиями:
Комбинирование flow matching с другими подходами к генеративному моделированию
для достижения лучших результатов.
Flow matching представляет собой значительный прогресс в
области генеративного моделирования, предлагая мощный и гибкий фреймворк для
синтеза сложных данных. Его теоретические основы в оптимальном транспорте и
дифференциальных потоках обеспечивают строгую основу для его дизайна, в то
время как его архитектура на основе нейронных сетей обеспечивает
масштабируемость и адаптивность3.
Как подчеркивает Ромбах, flow matching — это не просто
улучшение существующих технологий, а фундаментально новый подход к
генеративному ИИ, который открывает новые возможности для создания контента и
решения сложных задач в различных областях.
Subscription levels3

Бакалавр нейро-наук

$7.4 per month
Уровень для новичков и тех, кто хочет понять что у меня тут есть.
- Уроки по нейросетям, некоторые авторские воркфлоу, узлы и другое. 
- Ожидается 250 монет на Нейро-портале для генерации  (Пока не работает)

Магистр нейро-наук

$14.7 per month
Это для тех, кто уже долго в теме нейросетей и хочет больше знаний и навыков. Всё, что есть на предыдущих уровнях плюс:
- Особые уроки продвинутого уровня и некоторые бонусные материалы
- 500 монет ежемесячно на Нейро-портале (Пока не работает)

Кандидат нейро-наук

$37 per month
Это особая подписка, она содержит всё с предыдущих уровней.
Плюс + Некоторые авторские разработки:
 - все мои кастомные узлы для ComfyUI
 - все сборки нейросетей (ладно не все, но многие)
 - программы и утилиты
 - мини-курсы
ГЛАВНОЕ: по работе с коммерческими проектами или затыками в CU любой кандидат может спокойно проконсультироваться со мной на равных - чем смогу помогу. Это уровень моего максимума, поэтому общаемся на ТЫ.
Плюс ожидается 1000 монет на Нейро-портале для генерации (Пока не работает)
Go up