Ковыряю нейропиксели
В недавнее время я получил доступ к разным ИИ моделям для генерации изображений, и решил провести эксперимент: как сейчас обстоят дела с генерацией пиксельной графики. Ведь прошло уже два года с моих прошлых экспериментов, должны же быть улучшения?
С помощью DeepSeek был составлен простейший запрос:
Pixel art sprite of a beat 'em up game character, full body, side view, athletic male, short blonde hair, white t-shirt, blue jeans, large fists, idle standing pose. Strictly 24x48 pixels resolution, exactly 16 colors. No shading gradients, no anti-aliasing, crisp hard pixel edges. Flat retro game style, arcade era. Solid color background.
Максимально простая задачка для пиксельного художника. Результаты таковы:
Я не стал подписывать модели, потому что это не имеет большого смысла. Среди них были и Midjourney, и Grok, и GPT-Image, и Nano Banana, и разные другие популярные и не очень. Результаты схожи: если модель и умеет генерировать пиксели, как правило ей плевать и на запрошенное разрешение, и на цвета, и даже на требование показать персонажа в полный рост в нужной позе — чего с генерациями фотореалистичных моделей уже почти не происходит.
Впрочем, Grok и особенно Nano Banana дали неплохой результат. Выше три генерации в Grok в процессе попыток убедить его сделать спрайт нужного размера в полный рост.
А вот у Banana вообще получился идеальный спрайт на фоне прочих — чёткий, на чистом фоне. Но, конечно, разрешение опять не то, пикселей заметно больше, чем было запрошено.
Но не надо забывать, что это не реальные пиксели 1:1, а кластеры с размытыми границами и дробными размерами мета-пикселей, и их ещё надо как-то превратить в реальные пиксели. Сейчас работаю над этим.
Дополнительно я также попробовал дать Grok’у референс из Double Dragon и задачу:
Make a whole different character in exact same pixel limitations and poses. He is a bulky guy in blue jeans, yellow boots, square patterned dark-green shirt, he has a beard like Chuck Norris, and wears a yellow baseball cap.
Получилось более похоже, но странновато, и позы совсем не те:
Продолжаю наблюдения.
ии
рабочее