Я нахожусь в процессе создания конвейера данных для клиента. Я потратил много лет на анализ, но теперь я работаю с небольшим магазином, который действительно имеет производственную среду. Первое, что мы сделали, это создать реплицированный экземпляр производства, но я хотел бы применить своего рода менталитет хранилища данных, чтобы сделать часть анализа проще.ETL vs Workflow Management и какие применять? Можно ли их использовать одинаково?
Мой вопрос сводится к тому, какой инструмент использовать? Кроме того, почему? Я рассматривал такие решения, как Talened для ETL, но также очень заинтересован в Airflow. Проблема в том, что я не совсем уверен, что лучше всего подходит моим потребностям. Я хотел бы легко контролировать и создавать новые рабочие места (я пишу питона довольно свободно, так создание новых рабочих мест Воздушный поток не является проблемой), но и быть в состоянии преобразовать данные, как это происходит в.
Любые предложения очень ценятся
Которая может быть скомпенсирована с помощью contabs/Schedules и входа в централизованную базу данных. Он работает, ему просто нужно немного больше делать. – tobi6
Что вы подразумеваете под контролем? Если у вас есть 100+ заданий с 50 + шагами каждый, тогда TAC не будет предоставлять никаких функций мониторинга. Затем вам нужно сделать то, что сказал @ tobi6, войти в централизованную базу данных и сообщить об этом. –