Мне интересно услышать мнение других разработчиков о создании и загрузке данных, поскольку текущий сайт, над которым я работаю, имеет совершенно другой подход к загрузке DWH.MSSQL Создание и загрузка данных
Протокол, используемый в настоящее время для загрузки таблицы фактов, имеет несколько этапов;
- падение старый стол
- Recreate таблица без PK/кластерный индекс
- нагрузки очищено/новые данные
- Создание PK & индексов
Я интересно, как много работы на самом деле идет под крышками с шагом 4? Данные загружаются без индекса Clusterd, поэтому я предполагаю, что естественный порядок загрузки данных определяет его порядок на диске. Когда шаг 4. создает первичный ключ (кластерный), он будет переупорядочивать данные на диске в этом порядке. Не было бы лучше загружать данные и уже определил PK/Clustered Index, тем самым уменьшив рабочую нагрузку на сервер?
Только в том случае, если данные уже заказываются в том же порядке, что и индекс. В противном случае индекс должен постоянно обновляться –
@RichBenner, это неверно. Кластеризованный индекс влияет на фактический порядок хранения строк. Строки перемещаются –
@PanagiotisKanavos благодарит меня за обновление, я удалил неверный комментарий. –