Я создаю промежуточную область, которая получает данные из informatica cdc. Например, скажем, я реплицирую две таблицы для дополнительной загрузки. Я должен удалить обработанные данные из промежуточных таблиц после каждой загрузки. Я присоединяюсь к этим двум таблицам для заполнения моего целевого измерения. Проблема заключается в том, что изменение может происходить только на одном источнике, а не на другом в конкретной нагрузке.изменить данные захватить несколько таблиц для инкрементной нагрузки - ETL
Пример:
Employee
---------
ID NAME
1 PETER
EmployeeSal
------------
EMPID SAL
1 2000
Если выше тиражируется в моей первой загрузке, я объединить эти две таблицы и загружать их то отлично.
Теперь можно сказать, что зарплата peter обновляется от 2000 до 3000. Поскольку после каждой загрузки я удаляю свои промежуточные таблицы, у меня будет следующее значение для текущей нагрузки.
Employee
---------
ID NAME
EmployeeSal
-----------
EMPID SAL
1 3000
Вот моя проблема ss Я должен заполнить всю строку измерения, которая является TYPE2.
Я должен присоединиться к источнику, чтобы получить другие атрибуты таблицы сотрудников (Это просто хромой пример, на самом деле это может быть 10 таблиц и сотни тысяч изменений). Рекомендуется ли вернуться к источнику?
Я могу присоединиться к целевой таблице этого микса и заполнить недостающие атрибуты.
Является ли это даже рекомендуемым, поскольку мне приходится делать много аргументов case, nullhandlings и т. Д., Если конкретная промежуточная таблица не имеет изменений для записи измерения. Мой вопрос заключается в том, что даже эта таблица целей объединяется в трансформацию ETL?
Спасибо никогда не должны быть частью хороший вопрос. Отступ предварительно отформатированные блоки текста, выбрав их, а затем Ctrl + K – Anthon