DG4All

DG4All 

Data Governance для Чайников

84subscribers

98posts

Showcase

19

Data Vault - что это и как делать

Конечно, нужно читать базу, т.е. обратиться к первоисточнику. 
Но для начала что такое Data Vault - это шаблон проектирования хранилищ данных, предложенный Дэном Линстедом в уже далёком 2000 году. Сначала был просто Data Vault, а потом появился Data Vault 2.0, который исправил недочеты и разночтения первой версии. 
В основе моделирования по Линстеду лежат три ипостаси:
Хабы, Сателлиты и Линки.
Хаб - это объект моделирования типа сущность, который консолидирует под собой Сателлиты. 
В хабе записываются обычно только идентификационные ключи экземпляров сущностей, уникальные ключи и специальные технические поля для управления сущностью.
Сателлит - объект моделирования типа сущность, являющийся дочерним по отношению к Хабу. В сателлите хранится вся красота характеристик и свойств сущности.
Типизация Сателлитов возможна по принципам, которые вы сами для себя определите. Доминируют, обычно, такие варианты:
- типизация по системе источнику - собираем под одним хабом все сущности одного объекта, живущие в разных информационных системах (Сотрудник в ИС приёма на работу, Сотрудник в ИС обучения);
- типизация по бизнес-процессу источнику - под одним хабом храним различные варианты одной сущности, в зависимости от места возникновения с ракурса бизнес-процесса (Сделка на депозит, Сделка на ипотеку);
- типизация по версии сущности (изменения в составе атрибутов) - складываем в стопочку в хабе все изменения в жизненном цикле сущности, а именно изменения атрибутивного состава, т.е. новый сателлит создаём при появлении в промышленной среде нового варианта одной и той же сущности.
Думаю, что плюсы/минусы есть у всех вариантов, нужно выбирать что вам ближе. Можно миксовать, как вы понимаете. 
Линк - объект моделирования, связывающий между собой хабы. В моём понимании, линк - это всегда транзакционная история, которая регистрирует события, влияющие на состояние и свойства сущностей Хаба/Сателлитов - появление новых данных (экземпляров сущностей - новый Клиент, новый Договор), изменение их свойств (места хранения Посылки и статусы обработки Доставки).
И всё, пожалуй.
Подробности и особенности физической реализации каждого элемента модели Data Vault изучайте по приложенным материалам, советуйтесь с профессионалами.
Выкладываю книгу и вместе с ней спецификацию 2.0.
pdf
Building a Scalable Data Wareho - Dan Linstedt.pdf51.48 Mb
pdf
689085839-DVModelingSpecs2-0-1.pdf1.23 Mb
Глоссарий:
ИС - информационная система
Subscription levels3

Юзверь

$1.41 per month
Оставить чаевые автору :)
и получить ранний доступ к статьям и  материалам к ним (скачать можно в течение месяца с момента публикации)

Дата-Котик

$5.7 per month
Бессрочный доступ к статьям и материалам к ним

Мастодонт

$14.1 per month
Доступ ко всем статьям, материалам и к дополнительному контенту.
Или просто Большое спасибо автору
Go up