Владимир Жданкин

Владимир Жданкин 

Раньше занимался фотографией-теперь учу нейросеть.

24subscribers

33posts

goals1
$0 of $8 509 raised
Собрать деньги на серьезный второй комп под обучение нейросетей на основе ожидаемой к НГ новой видеокарты 5090.

Фотки снятые шириком в датасетах.....

Не так уж и редко бывает что на генерациях с людьми искажает пропорции людей как при съемке широкоугольным объективом - причем в запросе про ширик не упоминается.
Причина в том что народ пихает в датасеты что попало (да и не на всех фото эти искажения бросаются в глаза - но они есть) и не описывает особенности съемки в описании к фото в датсете.
Модели для создания описаний редко могут распознать ширик и его искажения и как правило ни как это не прописывают в описаниях.
А таких фото в инете море - фотографы очень любят уродовать людей шириками.... и эти фото идут в датасеты....
Для примера пару ярких примеров фоток из инета-перспективных искажений широкоугольной оптики на людях и на подобном тоже обучают....
А с развитием камер в телефонах где почти повально стоят ширики -эта проблема становиться все актуальнее. И дело даже не в самих ширках - а то что ими снимают еще и как попало с нижних и верхних точек и не подходящих ракурсов - что делает искажения еще заметнее...

Для наглядности анимашка разные ширики при съемке с правильной точки съемки и ракурса -они не так жутко бросаются в глаза и не так сильно уродуют людей.
А если снимать с нижней или верхней точки - то будет вообще жуть...
Но пишу не из-за этого - мне тоже надо в датасет добавить фото снятыми шириками и пришлось задуматься и попытать нейронку как правильно прописывать в датасетах подобные фото.
В PDF ответ perplexity.ai
pdf
Система теггирования широкоугольных изображений дл.pdf537.36 Kb
Go up