EN
DG4All
DG4All
46 subscribers

Инструмент моделирования данных

Рано или поздно, любая компания развивающая у себя дата-технологии и процессы, сталкивается с вопросом:
- как правильно моделировать данные?
- какой инструмент мне поможет?
Первый вопрос приведёт вас к необходимости выстраивания сквозного процесса моделирования данных внутри компании, в котором будут задействованы абсолютно все ИТ-команды, а не только дата-команды. Почему? Потому что идеальный мир начинается с логической модели данных продукта, а уже потом всё это должно перекочевать в физику информационных систем и на слои хранилища.
Но сегодня мой пост посвящен исключительно второму вопросу. 
Какой инструмент мне поможет поддержать сквозной процесс моделирования данных?
Какие вообще бывают системы моделирования или проектирования данных? Если вы хотите начать рисовать что-то простое, то вполне подойдут обычные инструменты визуального моделирования, такие, например, как Drawio. Но если объектов и проектов много, то появляется потребность переиспользовать одни и те же модели и объекты в разных продуктах, на разных диаграммах, при этом хочется иметь возможность синхронизировать их между собой. Что значит синхронизировать? Например, при изменении имени объекта на одной диаграмме необходимо, чтобы это имя автоматически изменилось на всех связанных с ним моделях. В этом случае нужно задуматься о том, чтобы перейти к работе в специализированных инструментах, которые позволяют хранить и поддерживать справочники объектов. Такой справочник объектов называют репозиторием. Наиболее распространенные и известные инструменты по соотношению цена/качество — это Sparx и Visual Paradigm. Ссылки на инструменты:
Чтобы правильно подобрать систему проектирования моделей данных, нужно определиться с тем, а какие требования вы предъявляете к этой системе? Что вы хотите получить от продукта, какие задачи он должен решать?
Чтобы ответить на все эти вопросы, необходимо немного опыта работы в моделировании данных :) и желание систематизировать свои знания, превратив их в функциональные требования к инструменту управления данными. И, конечно, нужно учитывать объективные потребности вашей собственной компании:
- как далеко вы можете/хотите зайти ради автоматизации процесса производства ИТ-сервисов и систем?
- готовы ли ИТ-подразделения и бизнес-заказчики к таким переменам?
Если поддержание Time2Market на текущем уровне и краткосрочные победы всё ещё важнее качества данных, эффективности принятия решений и снижения Time2Market на всём цикле доставки данных (это долгосрочная перспектива, конечно), то, наверное, вам рановато внедрять сквозные процессы управления моделированием данных. Но вы можете уже задумываться о точечной автоматизации и присмотреться к инструментам моделирования данных. 
В помощь тем, кто уже готов выбирать для себя инструмент моделирования данных, сформирована таблица функциональных требований, а также приведено сравнение по вышеуказанным системам.
Немного про ценовую политику
Анализ по ценам дан для указанных выше продуктов.
Приобрести лицензию для самостоятельной работы у Sparx можно начиная с 229 долларов. У VP вход значительно ниже - от 99$, также есть возможность купить подписку от 6$ в месяц, есть также ресурс VP-online, работать в котором можно совершенно бесплатно.
Большинство продуктов имеют градацию, где первый уровень (обычно это community) имеет минимальный набор функционала. На нем будет доступен только базовый  набор шаблонов и схем. Чаще всего для моделирования данных используют ER-диаграммы и они точно будут включены в минимальный пакет.
На более дорогих уровнях лицензирования появится доступ к таким режимам работы с инструментом, как импорт/экспорт ваших схем, совместная работа в команде, а также дополнительные наборы шаблонов диаграмм и схем. Например, нотации ArchiMate или Togaf, которые используют для моделирования и визуализации диаграмм для корпоративной архитектуры (Enterprise Architecture), будут доступны вам только в самом дорогостоящем варианте лицензий. И это уже будет стоить несколько десятков тысяч долларов.
Но если вы не замахиваетесь на автоматизацию всех уровней архитектуры, а хотите сосредоточится только на моделировании данных (архитектура данных), то ценник будет достаточно лояльный. Для работы в команде потребуется серверная лицензия. Ориентировочно стоимость пакета для совместной работы в команде плюс 10 конкуретных лицензий составит 10-15 тысяч долларов.
И Sparx, и VP предлагают воспользоваться тестовым периодом в один месяц, чтобы посмотреть и опробовать весь функционал продукта. Что это значит: вы скачиваете дистрибутив, устанавливаете его у себя и пользуетесь месяц бесплатно - полным набором всех плюшек. По истечении срока тестирования, вам предложат купить лицензию. 
Вопрос к коллегам. Если кто-то может предложить аналоги на нашем российском рынке или знает ещё инструменты, которые содержат репозиторий и остаются доступными на российском рынке - добро пожаловать в комментарии.

Subscription levels

Юзверь

$ 1,16 per month
Оставить чаевые автору :)
и получить ранний доступ к статьям и  материалам к ним (скачать можно в течение месяца с момента публикации)

Дата-Котик

$ 4,7 per month
Бессрочный доступ к статьям и материалам к ним

Мастодонт

$ 11,6 per month
Доступ ко всем статьям, материалам и к дополнительному контенту.
Или просто Большое спасибо автору
Go up