Алиса Цыганкова

Алиса Цыганкова 

Нейрохудожница, AI художница

12subscribers

29posts

Словарь нейронщика. Основные понятия и расшифровка их обычным языком.

Новички и только присоединившееся к теме нейросетей, узнают много непонятных слов, которые вообще слышат в первый раз) 
Чтобы упростить вашу работу и понимание моих уроков в мастерской, решила описать часто встречающиеся термины простым понятным языком. 
Пишите в комментариях, какие слова в нейромире вам ещё не понятны - будем пополнять словарь ✌

⚡ Генеративная нейросеть - это архитектура нейронной сети, которая используется для генерации новых данных на основе заданного набора обучающих данных. Т.е. это не ии, а программа, действующая по заранее заданным параметрам.
⚡ Промпт - текстовый запрос к нейросети. Текст, который мы вводим в интерфейс, чтобы запросить у нейро определенный результат.
⚡ Stable Diffusion (SD) - нейросеть для генерации изображений и видео. Преимущество её в том, что она лежит в открытом доступе и энтузиасты с удовольствием разрабатывают на основе её, а также в дополнение, модификации и плагины.
⚡ Основные интерфейсы, работающие на основе Stable Diffusion:
AUTOMATIC1111
Fooocus
ComfyUI
Forge
⚡ Подписочные нейросети (в веб интерфейсе), работающие на основе Stable Diffusion.
Krea.ai
Playground
Leonardo
Kaiber.ai и т.д.
⚡ Модель (checkpoint) - отдельная версия нейросети, которая обучена на определенных данных: текcтах, видео, изображениях, 3D и их разметке. У того же ChatGpt есть разные модели - cgpt-4, cgpt4o и т.д.
В Stable Diffusion мы устанавливаем разные модели, которые могут быть обучены например только на реализме или аниме.
⚡ LoRA (лора) - предобученая "мини-модель", которая дает добавление определенных деталей к изображению. Стиль, лицо, детали типа фейских крыльев или глиттер на одежде. Всегда добавляется к основной модели. Аналог - собственная стилизация sref в Midjourney
⚡ Inpaint - дорисовка/изменение внутри изображения, посредством использования нейросети.
⚡ Outpaint - внешняя дорисовка изображения, посредством использования нейросети. Догенерация внешних границ - например из изображения 1024х1024 можем сделать 1024х1460.
Upscale - увеличение изображения без outpaint. Может быть с дорисовкой деталей, может без. По ним есть урок в AI мастерской.
⚡ Deepfake - замена/синтез лица или голоса с помощью нейросети. В основном для замены лиц используют Lora, обученную заранее на чьем-то лице.
⚡ ControlNet - архитектура нейросети, которая помогает удержать определенные детали из загруженного заранее изображения или маски. Например так делают стилизацию - форма, силуэт, поза человека остается те же, но рисовка, цвет, предмет одежды и т.д. могут изменяться. По этой теме есть эфир на Ютубе.
⚡ Сокращения.
txt2img - генерация картинки из текста. Text to image.
img2text - генерация текста с картинки, когда нейросеть распознает изображение и выдает текстом то, что она "видит". В midjourney команда /describe
txt2video - генерация видео из текста.
img2video - "анимация" изображения в видеогенераторах, посредством загрузки в интерфейс заранее сгенерированного изображения и дописывания промпта (не обязательно). На выходе получается видео 4/5/6/10 сек - зависит от генератора.
⚡ Популярные в данный момент видеогенераторы:
1. Runway
2. Luma Dream Machine
3. Kling
4. Minimax
⚡ Flux - новая нейросеть для генерации изображений. НЕ SD
Go up