2015-11-30 6 views
0

У меня есть куб SSAS с жесткими отношениями. Ежедневно я получаю данные из источника за последние 2 месяца. Мой куб имеет данные с 2010 года. Я планирую разбить этот куб, а затем обработать его. Мои вопросы:Перегородка и процесс SSAS-куба для огромных данных

  1. Я знаю, что в жестких отношениях я должен идти с полным процессом. Означает ли это, что я должен обрабатывать весь раздел как Process Full, или я могу продолжить выделение раздела для полного процесса.
  2. Как я могу разработать свою стратегию раздела? Если я сделаю 2-месячный раздел, то в итоге я получу 6 разделов в год, а позже они могут увеличиться. Я думал о переходе на 6 месяцев. но если я на 7-й месяц или 1-й месяц, то я должен обработать два раздела (т. е. текущий + последний 6-й месяц). Это достаточно хорошо?

ответ

1

Отмечает атрибуты атрибутов как жесткие, когда они на самом деле изменяются (что означает, что смены рулонов, такие как продукт А, свернувшийся до категории зерновых и овсяных хлопьев) является плохой идеей. Просто отметьте их как гибкие отношения. Жесткая и гибкая не влияет на производительность запросов, а только на производительность обработки. И если Rigid заставляет вас делать ProcessFull по измерениям, это означает, что вы должны перерабатывать все разделы своей группы мер. Поэтому измените отношения на гибкие, если вы на 100% не уверены, что никогда не запускаете инструкцию UPDATE в своей таблице измерений в своем ETL.

Я бы разделил на месяц. Затем вы можете обрабатывать последние два месяца каждый день. Если быть более точным:

  1. ProcessUpdate ваши размеры
  2. ProcessData самые последние два месяца перегородками.
  3. ProcessIndexes на кубе (который перестраивает индексы и гибкие Aggs на старых перегородок)
+0

Спасибо вам за ответ. К сожалению, у нас много отношений, которые определены как жесткие, как в бизнесе, и мы не можем изменить это сейчас (например: демографические, дата, бизнес-процессы и т. Д.). Тем не менее, я должен продолжать так, это означает, что я должен идти с базой данных ProcessFull, даже если у меня есть групповой раздел меры? Эти шаги, которые вы упомянули, связаны с жесткими отношениями или гибкостью? – Zerotoinfinity

+0

Жесткая - это просто оптимизация. Я бы не стал пытаться принудить бизнес-правило к этому свойству. Пусть бизнес скажет вам, что демографические данные «должны» никогда не меняться, а затем вы проверяете его на то, что на самом деле происходит в ETL. Если это изменится, не позволяйте бизнесу диктовать технологию. Объясните им, что это изменилось, и вот пример. И измените отношение к гибкому. – GregGalloway

+0

На практике я вижу Rigid, который когда-либо использовался только для измерений Date, которые буквально жестко закодированы. Используйте Flexible и ProcessUpdate. Не используйте Rigid и ProcessFull, поскольку это полностью отменяет цель оптимизации – GregGalloway