Постановка задачи -Как сравнить репликацию в больших данных
Replications обычные задачи в промышленности и ее не менее важно, чтобы проверить репликацию, если реплицируется база данных имеет одни и те же данные, как же, как в исходной базе данных.
Пример -
У меня есть база данных D1 и для целей тестирования я тиражирование базы данных D1 до D2 базы данных.
После завершения репликации, я хочу проверить, идентичны ли обе базы данных или нет, что может быть сделано с использованием сравнения строк, однако его худшее решение для больших баз данных, где длина данных может быть в терабайтах.
Могут ли эксперты предоставить решение или любой намек на такие проблемы в реальном времени?
Стоит отметить: Hadoop - это не база данных –