Каталог данных – централизованный источник о данных компании, который позволяет хранить, описывать и агрегировать информацию об их состоянии.
Каталог данных позволяет создать единую систему поиска по метаданным компании, обеспечить централизованное ведение документации и глоссария терминов, определений и метрик.
Ещё он наглядно демонстрирует связи между данными от источника до отчётов, делает данные универсальными и исключает их дублирование в разных системах.
В целом функциональность нашего каталога данных можно перечислить так:
- Ведение физической модели данных (ФМД), которая содержит описание таблиц, атрибутов таблицы, связи таблиц в базе данных;
- Ведение связей между данными от источника до отчётов/визуализаций, в которых эти данные были использованы (Data lineage);
- Ведение логической модели данных (ЛМД), которая оперирует бизнес объектами и содержит их описание, атрибутный состав и взаимосвязь;
- Ведение описаний массива данных и логических отчетов;
- Ведение визуализаций (например, Tableau);
- Ведение метрик/показателей компании;
- Ведение ролевой модели данных (Active directory, SAP GRC, IDM-системы);
- Визуализация проводимых проверок качества данных Data Quality;
- Ведение бизнес-процессов компании;
- Глобальный поиск по всем данным Каталога.
Повышение доли описанных данных в СИБУРе
60%
Ускорение получения доступа к данным
в 4 раза
Количество подключенных систем
>70