2

В некоторых вопросах я смущен. Мне нужны их ответы. Если наша реляционная модель также де-нормализует, то почему мы предпочитаем размерную модель? По какой причине мы предпочитаем размерную модель над реляционной моделью? Ваши исторические данные также могут храниться в OLTP, и вы можете легко выполнять отчетность на любом OLTP, а затем, почему мы используем размерную модель и хранилище данных? В чем разница между размером и де-нормированной таблицей?Почему мы используем размерную модель по ненормализованной реляционной модели?

Заранее спасибо

ответ

8

Короткий ответ:

Если ваши поиски/извлечений из таблиц OLTP являются достаточно быстро, и ваши конкретные требования поиск сделать не имеют такие осложнения, как описано ниже, тогда не должно быть необходимости входить в какие-либо размерные звездные схемы.

Длинный ответ:

Размерные и Денормализованные модели имеют разные цели. Модели размеров обычно используются для сценариев хранилищ данных и особенно полезны там, где требуются сверхбыстрые результаты запроса для вычисляемых чисел, таких как «квартальные продажи по регионам» или «продавцом». Данные сохраняются в модели Dimensional после предварительного расчета этих чисел и обновляются в соответствии с определенным фиксированным расписанием.

Но даже без хранилища данных участвуют, размерная модель может быть полезным, и его цель может дополнять модели Денормализованных, как в следующем примере:

Dimensional model позволяет быстрого поиска. Соединения между dimension tables и fact table настроены в star-schema. Поиск Джона Смита будет упрощен, потому что мы будем искать John OR Smith только в соответствующей таблице измерений и выбивать соответствующие идентификаторы людей из таблицы фактов (таблица фактов FK указывает на PK таблицы размеров), тем самым получая всех лиц с из 2 ключевых слов от их имени. (Дальнейшее расширение позволит нам искать для всех лиц, имеющих варианты «Джон Смит» в их имена, например, Джон, Джон, Джонни, Джонатан Смит, Псмит, Смайт путем создания snowflake размеров.)

Denormalized model , с другой стороны, позволяет быстро получать , например, возвращать много столбцов по определенному элементу без объединения нескольких таблиц.

Итак, в приведенном выше сценарии мы сначала используем модель Dimensional для получения набора идентификаторов для интересующих нас лиц, а затем используем таблицу Denormalized, чтобы получить полную информацию об этих отобранных идентификаторах, не делая никаких дальнейших действий присоединяется.

Этот поиск будет очень медленным, если мы непосредственно запросим Denormalized таблицы, потому что текстовый поиск нужно будет выполнять в столбце PersonName. Он становится еще медленнее, если мы попытаемся включить вариации имен или нам нужно добавить больше критериев поиска.

Отлично ссылка:

Отличный справочник для изучения обширной (и очень интересная) тема многомерное моделирование Ральф Кимбалл The Data Warehouse Lifecycle Toolkit. Сопутствующий объем The Data Warehouse Toolkit охватывает большое количество реальных случаев использования.

Надеюсь, это поможет!

+0

Пространственная модель не обязательно предварительно вычисляет числа на агрегированном уровне, но может сделать это по дополнительным причинам производительности. Вместо «сырой» размерной модели на гранулированном подробном уровне и числа агрегируются во время запроса. Я также не вижу различия между быстрым поиском и быстрым поиском. В некоторых отношениях размерные модели также денормализуются. Пример «john», «jon» также не является примером измерения снежинки, и вы не использовали бы сначала мерную модель и денормализованную таблицу. Измерение денормализировано и содержит все подробные данные. – Rich

1

Пространственная модель использует денормализацию в качестве одного из своих методов для оптимизации базы данных для: - производительность запросов и - понимание пользователем.

OLTP-системы, как правило, трудно отчитываться и замедляться, оптимизируются так же, как для OLTP (вставка, обновление, удаление), а также для защиты целостности транзакций. Хранилище данных, использующее размерную модель, по-прежнему использует реляционные методы, но вместо этого оптимизировано для рассмотрения опыта получения данных из-за получения данных.

Истина заключается в том, что вы не всегда можете легко сообщать о любых OLTP-файлах система: таблицы часто неясно называются без учета того, что люди захотят получить данные для принятия бизнес-решений. Средства отчетности, которые генерируют SQL, также затрудняют выполнение исполнительных запросов на вашей типичной нормированной схеме.

Современные достижения в технологиях OLTP предоставляют альтернативы размерным моделям, которые затрагивают проблемы с производительностью, но при этом не справляются с типичными шагами, предпринятыми при создании размерной модели, чтобы упростить понимание и навигацию таблиц базы данных.

Измерение представляет собой таблицу, предназначенную для представления бизнес-концепции или сущности, давая контекст конкретному измерению бизнес-процесса (или «факта»). Размеры, как правило, денормализуются в размерной модели как для уменьшения количества таблиц для понимания/навигации, так и для уменьшения количества объединений по соображениям производительности. Например, размер продукта может связываться с информацией о бренде, тогда как в OLTP-модели это будут отдельные таблицы, которые позволяют пользователям напрямую фильтровать Fact by Brand без прохождения нескольких таблиц.