В настоящее время у меня есть таблица из 3-х записей, которая нуждается в обновлении в ночное время. Данные, которые заполняют эту таблицу, поступают от ~ 100 API, которые все нормализуются в одну таблицу jumbo., отражающий удаление записей/добавление между двумя наборами данных
Задача: Как отразить добавленные новые записи и удаленные записи в источнике?
Факты: Я не могу усекать стол каждую ночь и снова вставлять. Каждый API предоставляет постоянный идентификатор для каждой записи (поэтому я могу отслеживать, что к чему). Некоторые поля будут обновляться каждую ночь.
Решения: Новые записи просты, я просто добавляю их в свой стол с датой AvailableFrom. Обновления также просты, для каждой записи я проверяю, существует ли она, и если данные были изменены (производительность будет сосать).
Удаленные записи, где я застрял. API-интерфейсы просто сбрасывают мне нагрузку данных, как я могу сказать, что запись «выпала»?
Я думаю своп-таблицу какого-то рода - любые идеи?
Спасибо, я пошел на первое решение. Решение 2, вероятно, более аккуратное (я могу создать объекты импорта со статистикой и т. Д.), Но вместо этого я добавил столбец LastUpdated. Отдельный процесс затем очищает старые строки. Полный импорт уничтожит идентификаторы таблиц, на которые ссылаются в других местах. – jimi