При использовании MLCP у меня возникла странная проблема с параметром '-batch_size', указанным в файле параметров (options.txt) при копировании документов из одной базы данных в другую, например, если -batch_size = 10 и количество документов, которые должны быть переданы (на основе параметров фильтрации имеется) и теперь я выполнить команду: mlcp.bat -options_file "options.txt"
Передача частичного документа при разделении пакетами MLCP
содержания статистика насос полученные являются:
INFO contentpump.LocalJobRunner:com.marklogic.mapreduce.ContentPumpStats:
INFO contentpump.LocalJobRunner: INPUT_RECORDS: 106
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS: 106
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_COMMITTED: 100
INFO contentpump.LocalJobRunner: OUTPUT_RECORDS_FAILED: 0
INFO contentpump.LocalJobRunner: Total execution time: 37 sec
Кажется, что остаток документы, оставшиеся после дозирования (размер партии = 10), который 10 * 10 + 6, то 6 документов не передаются в нужной базе данных.
Таким образом, так или иначе, он передает только документы, которые попадают под полные партии, а не левые документы, которые не могут сформировать полную партию.
Может кто-нибудь, пожалуйста, предложите обходной путь для этого и причину такого поведения.
улучшенное форматирование и объяснение – Stallion
Это, как правило, не бывает. Даже без флага '-batch_size' у вас будет несколько партий, так как значением по умолчанию является' 100'. Вы уверены, что это почему-то не вызвано не-уникальным ури? Если вы уверены, что это ошибка, об этом следует сообщать в поддержку MarkLogic. Вы имеете право на поддержку? – grtjn
Также можно проверить фактический счетчик данных базы данных, например, Query Console. «MLCP» может (теоретически) просто печатать неправильный номер .. – grtjn