Foundation models в геоаналитике
Этот пост вдохновлен Population Dynamics Foundation Model (PDFM), выпущенной Google месяц назад. Для меня это была новая концепция, поэтому показалось интересным разобраться, что такое Foundation Model в контексте пространственного анализа. А так как тема очень актуальная, то решила сделать этот лонгрид доступным для всех)
P.S. по мере изучения модели, стало понятным, что пост получиться скорее познавательным, чем прикладным, поскольку модель Google покрывает только США, но знать, что такое существует все равно, на мой взгляд полезно.
Foundation models
Foundation model - это особенно модный нынче в data science термин, обозначающий универсальные модели, обученные на очень большом количестве данных, которые можно применять к большому набору разных задач. Обычно речь идет о deep leaning моделях. DALL-E и GPT-4 - это примеры foundation models. Их можно использовать как конечные модели для решения отдельных задач: например, распознавания/генерации текста и изображений - в этом случае они управляются промтами (Prompt engineering), так и для создания собственной модели под конкретную задачу. Именно так можно использовать новую модель Google.
То есть вместо того, чтобы с 0 собирать данные и обучать модель, можно только донастроить (fine-tune) существующую модель на небольшом семпле, собранном под конкретный кейс.
Вот
ссылка на маркетплейс амазон, чтобы понять какие типы предобученных (pre-trained) моделей существуют