Осторожно! Зона первичных данных!
-
Просто
-
40 мин
Разработка хранилища данных (DWH) – сложная и интересная задача, включающая в себя интеграцию большого количества разных, абсолютно непохожих друг на друга источников.
Первый этап организации DWH – это создание слоя первичных данных. Конечно, фокус сосредоточен на интеграциях, однако, какие они должны быть?
Разнообразие источников и необходимость включения их в контур хранилища требует внедрения различных механизмов интеграции в зависимости от архитектуры источников и формата отдаваемых данных. С другой стороны, реплики источников в контуре данных должны обладать архитектурной упорядоченностью, т.к. использование их предполагается в ядре DWH с максимальных отрывом от знаний об источниках. Все это накладывает особые требования к интеграциям.
Как же должен быть организован слой первичных данных? На что стоит обратить особое внимание? Что на этом этапе делает аналитик, в каких процессах участвует?
Целевая аудитория - системные аналитики и архитекторы. Опыт работы с хранилищами данных не нужен