Data Vault - что это и как делать
Конечно, нужно читать базу, т.е. обратиться к первоисточнику.
Но для начала что такое Data Vault - это шаблон проектирования хранилищ данных, предложенный Дэном Линстедом в уже далёком 2000 году. Сначала был просто Data Vault, а потом появился Data Vault 2.0, который исправил недочеты и разночтения первой версии.
В основе моделирования по Линстеду лежат три ипостаси:
Хабы, Сателлиты и Линки.
Хабы, Сателлиты и Линки.
Хаб - это объект моделирования типа сущность, который консолидирует под собой Сателлиты.
В хабе записываются обычно только идентификационные ключи экземпляров сущностей, уникальные ключи и специальные технические поля для управления сущностью.
Сателлит - объект моделирования типа сущность, являющийся дочерним по отношению к Хабу. В сателлите хранится вся красота характеристик и свойств сущности.
Типизация Сателлитов возможна по принципам, которые вы сами для себя определите. Доминируют, обычно, такие варианты:
- типизация по системе источнику - собираем под одним хабом все сущности одного объекта, живущие в разных информационных системах (Сотрудник в ИС приёма на работу, Сотрудник в ИС обучения);
- типизация по бизнес-процессу источнику - под одним хабом храним различные варианты одной сущности, в зависимости от места возникновения с ракурса бизнес-процесса (Сделка на депозит, Сделка на ипотеку);
- типизация по версии сущности (изменения в составе атрибутов) - складываем в стопочку в хабе все изменения в жизненном цикле сущности, а именно изменения атрибутивного состава, т.е. новый сателлит создаём при появлении в промышленной среде нового варианта одной и той же сущности.
Думаю, что плюсы/минусы есть у всех вариантов, нужно выбирать что вам ближе. Можно миксовать, как вы понимаете.
Линк - объект моделирования, связывающий между собой хабы. В моём понимании, линк - это всегда транзакционная история, которая регистрирует события, влияющие на состояние и свойства сущностей Хаба/Сателлитов - появление новых данных (экземпляров сущностей - новый Клиент, новый Договор), изменение их свойств (места хранения Посылки и статусы обработки Доставки).
И всё, пожалуй.
Подробности и особенности физической реализации каждого элемента модели Data Vault изучайте по приложенным материалам, советуйтесь с профессионалами.
Выкладываю книгу и вместе с ней спецификацию 2.0.
pdf
Building a Scalable Data Wareho - Dan Linstedt.pdf51.48 Mb
pdf
689085839-DVModelingSpecs2-0-1.pdf1.23 Mb
Глоссарий:
ИС - информационная система
data modeling
хранилище данных