Хранилища и киоски данных

Оценить
(1 голос)

Data warehouse - хранилище данных - представляет собой набор данных, которые были сгенерированы другими действующими приложениями и, возможно, внешними системами. Например, информация о продажах может быть упорядочена и сохранена в хранилище для последующего анализа и создания агрегированных данных. Данные вовсе не обязательно должны представляться с точностью до минуты; обычно -по самому последнему обновлению (возможно, ежедневному).

Хранилища данных чаще ориентированы на объекты, нежели на транзакции. Лучше всего организовывать данные по предметным областям, таковыми являются, например, данные о продажах, чем организовывать их в соответствии с источником информации. И поскольку могут быть интегрированы данные из разных источников, например, с различными кодами продукции, то необходимо использовать общие правила кодировки. Обычно природа данных историческая, и в плане детализации они содержатся на различных уровнях. Данные хранилища, как правило предназначены только для чтения, не считая периодических обновлений.

После извлечения из источника и перед их загрузкой в хранилище данные обычно преобразовываются в более подходящую форму. Пригодность хранилища зависит от точности и целостности его данных, поэтому для надежности конечного результата может понадобиться процедура очистки данных.

Сохранение метаданных, или данных (характеристик), описывающих другие данные, облегчает понимание информации и обычно осуществляется на практике. Примерами метаданных являются метаданные накопления, используемые для описания источников информации и алгоритмов, применяемых для суммирования данных, или же метаданные преобразования, включая историю преобразования метаданных, а также метаданные доступа, предусматривающие навигацию и графические интерфейсы пользователя и делающие доступ к данным более интуитивным для широкого круга пользователей.

Иногда таблицы хранилища данных структурно организовываются в виде схемы звездообразного типа. В этих схемах используются таблица фактов и окружающие ее таблицы размерностей. На рисунке 6.1 приведена звездообразная схема.

Центральная таблица фактов в этом примере - это таблица истории продаж, содержащая большое количество строк, отражающих индивидуальные продажи с внешними ключами в каждой строке; ключи указывают на некоторое количество таблиц меньшего размера, таких как Наименование, Поставщик, Заказчик. Результирующая схема немного похожа на реальные таблицы в системе OLTP, из которой были извлечены данные, однако этот тип структуры может оказаться более подходящим для деятельности хранилища данных. К примеру, такая структура может быть более эффективной, если сначала выполнять объединения данных из таблиц размерностей, а затем быстро извлекать необходимые строки из таблицы фактов, чем производить объединения непосредственно в таблицах OLTP.

Подробнее в этой категории: « OLTP Киоски данных »
Киоски данных
ODS
Извлечение информации
Пакетные рабочие нагрузки
О LAP

Добавить комментарий


Защитный код
Обновить