В схеме звездных схем таблицы размеров таблицы фактов являются обязательными. Во многих бизнес-ситуациях модельер может с достаточной уверенностью предположить, что некоторые значения измерений не будут меняться без контроля. Например, Пол иногда используется как измерение, где на самом деле он может быть столбцом в таблице фактов.Свертывание редких изменений в столбце фактов
Я не уверен, что люди всегда думают об этом. Легче просто добавить измерение и не думать об этом. Однако, как один из правил Кимбалла, не должно быть слишком много измерений для таблицы фактов (я думаю, что число, которое он предложил, составляет около 20).
я взял пол в качестве примера, но есть много других, таких как государственное название, название города, кредит типа карты и т.д.
Мой вопрос:
Какое правило нужно использовать, чтобы решить, следует ли вставлять/сворачивать значение в таблице фактов против наличия отдельного измерения для него? Некоторые из возможных ответов: 1. Когда он не изменяется (например, пол). 2. Когда он имеет несколько возможных значений и имеет короткую длину?
Что еще?
EDIT
Даже если я рассмотрел этот вопрос ответил, я все-таки пошел на дальнейшие исследования. Существует случай, когда у вас есть может иметь, чтобы использовать измерение. Дело здесь: «Факультативные размеры часто используются для поддержки действий сверления, потому что для сквозного действия в службах анализа SQL Server (SSAS) требуется, чтобы вы выбрали атрибуты из измерения. Поэтому, если вы хотите видеть определенные поля, когда они выполняют упражнение, вы должны иметь эти поля в измерении ».
выше цитировали здесь Degenerate Dimensions
Я думаю, что вопрос требует дальнейшего анализа для заинтересованного лица (лиц).
Благодарим вас за подробный ответ, и я согласен с ним. Просьба уточнить часть «... и если вы начнете сдавать свое измерение, может ... пострадать». Я думаю, что вы имеете в виду здесь, что длина текста может быть> длиной FK, что является интересным моментом, который я раньше не рассматривал! Еще раз спасибо. – NoChance
Добавлена новая модификация @NoChance. Я думал о случаях, когда несколько столбцов можно было заменить одним ключом измерения, но да, даже отдельные столбцы могли бы ухудшиться в зависимости от типа и размера данных. Кимбалл предлагает использовать вырожденные размеры, в которых размер в противном случае имел бы один атрибут, но он делает исключение для больших вещей, таких как поля «заметки» - он предлагает выталкивать их в свое измерение по соображениям производительности, а не оставлять их на самом деле. –
Спасибо за ваши объяснения. Я также помню, что хотя бы один инструмент запросов OLAP зависел от существования таблицы физических измерений, чтобы помочь пользователю создать отчет. Если кто-то разрушит измерение, такие инструменты могут не распознать столбец, и это может привести к сбою отчетов с использованием таких инструментов. Я хотел знать об этом, но, я думаю, это выходит за рамки текущего вопроса. – NoChance