2012-03-26 2 views
13

У меня есть на каждой странице моего PDF документа строки с этой строкой:Как найти и заменить текст в существующем PDF файл с Pdftk (или другим приложением командной строки)

%REPLACE%

Что я d хотел бы найти и заменить другой строкой.

Кто-нибудь знает, как это сделать с помощью некоторых приложений командной строки, таких как PDFTK?

Этот folk дал мне важную подсказку, однако мне хотелось бы что-то более прямое.

Спасибо.

ответ

30

Вы можете попытаться изменить содержание вашего PDF следующим

  1. Распаковка текстовые потоки PDF

    pdftk file.pdf output uncompressed.pdf uncompress 
    
  2. Используйте SED заменить текст с другой

    sed -e "s/ORIGINALSTRING/NEWSTRING/g" <uncompressed.pdf >modified.pdf 
    
  3. Если этот атте MPT была успешной, повторно сжать PDF с Pdftk

    pdftk modified.pdf output recompressed.pdf compress 
    

Примечание: Этот способ не является успешным каждый раз, когда, в основном из-за Подменю шрифта

+0

Я не могу сделать эта работа с файлом PDF экспортируется из Google Docs (даже если я выбираю arial как единственный шрифт). Я боюсь, что мне придется использовать какое-то другое приложение только для написания страницы, а затем попробовать очень простой и замечательный код, который вы написали ... – Roger

+1

с * pdfedit * у вас может быть больше шансов (если шрифты полностью встроены) редактировать текстовый контент - http://pdfedit.cz/ru/index.html – Dingo

+0

Проблема в том, что мне нужно сделать все это на сервере ... – Roger