DG4All

DG4All 

Data Governance для Чайников

86subscribers

99posts

Showcase

19

Инмон. Построение хранилищ данных

Сначала решила просто полистать на досуге, но залипла на пару недель, и знаете что поняла - не даром Инмон зовётся "отцом хранилищ". Он про всё рассказал и объяснил как делать и почему надо делать так ещё в 90-х (у меня правда третье издание 2005г)! Никакого колеса изобретать не надо, а просто брать и адаптировать к текущим реалиям всё то разумное и светлое, что он написал. Не актуальное осмысливается и отбрасывается, актуальное берётся в работу. А мы всё на каких-то методичках учимся - читайте матчасть! В который раз убеждаюсь.
Ниже привожу немного полезных мыслей из различных частей этой книги.
Хранилище данных является сердцем архитектурной среды и основой всех задач по обработке и анализу данных. Вот некоторые из наиболее важных аспектов, характеризующих современные принципы проектирования хранилища данных:
1. Хранилище проектируется как объектно-ориентированное
2. Данные интегрируются и приводятся к единому виду
3. Данные не изменяются и не удаляются однажды попав в хранилище
4. Историчность важна для всех объектов хранилища
И что тут неверно и не применимо сегодня?
Другие важные замечания:
- Во всех случаях хранилище данных лучше всего строить итеративно.
- Метаданные и управление контекстом данных становятся невероятно важными в хранилище данных, в отличие от классической OLTP-среды.
- Детальный слой данных необходим для получения хранилища достоверных данных, в котором отсутствует избыточность и разночтение данных, и в то же время обеспечивается гибкость.
- Может быть неочевидна роль модели данных в итеративной разработке, но моделирование является важной частью процесса создания хранилища. Когда различные итерации разработки выполняются без унифицирующей модели данных, возникает много дублирования усилий и много отдельной, разрозненной разработки.
Вопросы моделирования данных хранилища рассматривают в 3-й главе. Инмон предлагает использовать в работе три уровня моделирования данных:
1. Верхнеуровневое с помощью ERD
2. Среднеуровневое моделирование DIS
3. Моделирование физического слоя

Никаких упоминаний о концептуальной или логической модели данных нет, но именно они подразумеваются под верхнеуровневым моделированием и средним уровнем соответственно. За подробностями - к автору ))
Не обнаружила в книге никаких упоминаний про подход "снежинка", зато нашла паттерн проектирования звезда )), который предполагает расположение в центре модели сущности типа "факт" и присоединение к ней "измерений" - второстепенных или непопулярных сущностей (как их называет Инмон). Как пишет сам Инмон, применимо это только для проектирования витрин, а не для детального слоя хранилищ.
Книга Инмона "Проектирование хранилищ данных" прилагается в файле.
pdf
W_H_Inmon-Building_the_Data_Warehouse-EN.pdf1.46 Mb
Ну что ж, скачала себе ещё и Кимбалла, пошла читать, устранять пробелы в образовании (выложу чуть позже).
Subscription levels3

Юзверь

$1.48 per month
Оставить чаевые автору :)
и получить ранний доступ к статьям и  материалам к ним (скачать можно в течение месяца с момента публикации)

Дата-Котик

$5.9 per month
Бессрочный доступ к статьям и материалам к ним

Мастодонт

$14.8 per month
Доступ ко всем статьям, материалам и к дополнительному контенту.
Или просто Большое спасибо автору
Go up