Я ищу для объединения PDF-файлов из двух отдельных папок в третью папку на основе имени файла.Объединить PDF-файлы из нескольких папок с одинаковым именем файла
структура каталогов:
FOLDER_1 = File set #1.
FOLDER_2 = File set #2.
MERGED_PDFS = Output of merged files.
FOLDER_1 содержит набор PDF-файлов, которые можно было бы назвать с любой комбинацией букв, цифр и разрешенных символов.
FOLDER_2 содержит набор PDF-файлов с такими же именами, как FOLDER_1. Данные на этих листах различны. Файлы из FOLDER_2 необходимо вставить в файлы из FOLDER_1, в конце файла.
Результат этого объединенного файла будет помещен в папку MERGED_PDFs, сохранив имя, используемое для сопоставления файлов в FOLDER_1 и FOLDER_2.
Пример:
FOLDER_1: R000135322.PDF
FOLDER_2: R000135322.PDF
MERGED_PDFS: R000135322.PDF
(MERGED_PDFS contains a merged PDF from FOLDER_1 & FOLDER_2, with the PDF from FOLDER_2 being placed at the end of the PDF in FOLDER_1.
Я видел несколько подобных примеров этого делается с Pdftk, но не знает, как изменить, чтобы получить мой ожидаемый результат.
Благодаря
Вы забыли задать вопрос. – IInspectable
Вы не объяснили много, просто хотите, чтобы некоторые файлы * каким-то образом слились. Неясно, какое ваше понимание * «слияния» * есть, какой язык программирования вы хотите использовать, и с чем у вас возникают трудности. Этот вопрос, вероятно, вне темы (см. [Help/on-topic]) для переполнения стека. – IInspectable
Вы сильно недооцениваете сложность формата PDF-файла. PDF-файлы представляют собой структурированное хранилище, и слияние может быть осуществлено миллионами способов, например. добавление текста сразу после существующего текста или перенос его на новую страницу. Возможно, ссылки должны быть объединены в один раздел, то же самое касается сносок. Может потребоваться обновление оглавления или перекрестная ссылка на изображения и таблицы. Как насчет противоречивых метаданных '/ Author','/Producer' или '/ Title'? – IInspectable