Ответ: Это зависит.
Абсолютным минимальным требованием является то, что вы можете связать клиентов с различными исходными системами.
Теоретически вы можете создать таблицу мостов с естественными ключами (уникальными идентификаторами) из различных исходных систем в виде столбцов, заполнить их с помощью какого-либо алгоритма соответствия и позволить платформе отчетности работать с объединением данных.
На практике, вы будете работать в мир боли на всех, кроме самых простых систем, когда вы попробуете это:
- Бесконечные несовпадения данных погубит веру в точности, так как нет общих определений между источником системы.
- Отчет производительности поколения неприемлем со многими, многие присоединяется
- Производственные системы могут быть затронуты в докладе запросов
- Изменения в исходных системах перерыв отчетности неожиданным образом
Настройка DataMart или хранилища данных является предназначенный для решения всех этих проблем. Вы извлекаете производственные данные один раз, а не каждый отчет, очищаете и проверяете содержимое, преобразуете его в формы, оптимизированные для отчетности, и представляете их конечным пользователям в согласованном виде.
Если ваше представление на 360 ° сосредоточено на четко определенных транзакциях/взаимодействиях, особенно если они взаимосвязаны (т. Е. Поддерживают билеты, связанные с продуктами, приобретенными в последнее время), а затем инвестировать время для анализа всех входящих данных и унификации значений аналогичных данные из разных источников, вероятно, являются единственным разумным вариантом. Написание всех этих правил на уровне ETL проекта Data Warehouse делает его более эффективным и более легким в обслуживании, чем встраивание логики в каждый отчет отдельно.
Если у вас есть куча ученых-данных, которые проводят свои собственные анализы, которые не обязательно должны видеть числа, соответствующие последней цифре каждый раз, возможно, вам удастся сбрасывать полуструктурированные данные из каждой исходной системы вместе в базу данных NoSQL или подобное хранилище с единственным уникальным идентификатором клиента, чтобы объединить их.
спасибо, что отлично – user3454809