2011-07-26 6 views
4

Я знаю основную разницу между схемой звезды и схемой снежинок - схема снежинок разбивает таблицы измерений на несколько таблиц, чтобы их нормализовать, схема звезд имеет только один «уровень» таблиц измерений. Но Wikipedia article для Схемы Снежинки говоритЯвляется ли схема снежинок лучше, чем схема звезды для интеллектуального анализа данных?

«Некоторые пользователи могут отправить запросы в базу данных, которые, используя обычные многомерные средства отчетности, не могут быть выражены в простой звездной схеме, что особенно характерно для интеллектуального анализа данных клиентских баз данных, где общее требование заключается в определении общих факторов между покупателями, которые покупают продукты, отвечающие сложным критериям. Некоторое заснеживание обычно требуется, чтобы позволить простым инструментам запросов формировать такой запрос, особенно если предоставление этих форм запроса не ожидалось, когда данные склад был спроектирован впервые ».

Когда невозможно было бы написать запрос в схеме звездочки, которая может быть записана в схеме снежинки для тех же базовых данных? Кажется, что звездообразная схема всегда допускает одни и те же запросы.

ответ

6

Для сбора данных вы почти всегда должны подготовить свои данные - в основном как «плоский стол».

Это может быть запрос, подготовленный просмотр или экспорт CSV - зависит от инструмента и ваших предпочтений.

Теперь, чтобы правильно понять эту статью, можно было бы, вероятно, курить, пить то же, что и автор, когда он ее написал.

0

Как вы упомянули, подготовка плоской таблицы для интеллектуального анализа данных, начиная с реляционной базы данных, не является простой задачей, а снежная или звездная схема работает только до определенной точки.

Однако есть программное обеспечение под названием Dataconda, которое автоматически создает плоскую таблицу из БД.

В принципе, вы выбираете целевую таблицу в реляционной базе данных, а dataconda «расширяет» ее, добавляя к ней тысячи новых атрибутов; эти атрибуты получаются путем выполнения сложных запросов с использованием нескольких таблиц.

 Смежные вопросы

  • Нет связанных вопросов^_^