2017-02-22 48 views
0

У меня есть спутник Person с атрибутом Gender. Из исходных систем значения для этого атрибута могут быть: F, M, FEMALE или MALE. Какой из двух следующих подходов является правильным для моделирования Data Vault?Как использовать таблицу перекрестных ссылок в базе данных, смоделированную с использованием принципов Data Vault?

  1. Хранить данные Пола, как это происходит от источников и в Business Vault или витринах данных стандартизировать значения женской и мужской только

  2. Создать таблицу перекрестных ссылок на карту из F самок и M в MALE, при загрузке спутника Person преобразуйте F в FEMALE и M в MALE, используя таблицу перекрестных ссылок.

Я использую Amazon Redshift, который поддерживает сжатие столбцов.

+0

Я не могу ответить на ваш вопрос, но я говорю, что Redshift и DV звучат как болезненная комбинация. По моему опыту производительность Redshift сильно ухудшается по мере увеличения количества соединений. –

+0

Спасибо, @ Джо Харрис. Я понимаю о множественных объединениях. У меня будет несколько PIT и мостов в Business Vault, чтобы помочь в этом, а также создать ряд конкретных информационных карт для конечных пользователей, которые представят более унифицированное представление данных. –

ответ

0

Я отправил письмо по электронной почте Даниэлю Линстедту, создателю метода моделирования хранилища данных, чтобы задать ему тот же вопрос. Его ответ:

«Я обычно храню его, когда он входит, а затем переводите его по пути к бизнес-DV. Таким образом, если бизнес когда-либо изменится, мы можем переписать правило перевода, не затрагивая историю Но более того, я видел исходные системы, которые доставляют ценности за пределами того, что приемлемо. Не пытайтесь перевестись на Raw DV, чтобы это могло нарушить аудитоспособность ».

0

Концепция хранилища данных полезна, когда у вас очень сложная бизнес-логика, которая меняется с течением времени, но отображение F/Female и M/Male - довольно простая и стабильная логика. Перекрестная ссылка будет просто чрезмерно сложной. Я бы просто стандартизовал значения для F/M и использовал столбец char (1) без сжатия здесь.

+0

Спасибо, @AlexYes. Я также имею идею стандартизации этих ценностей. Тем не менее, мне больше интересно узнать о недостатках этого, поскольку принципы Data Vault ясно указывают на то, что в Raw Vault не должно быть никаких преобразований –