2016-09-02 3 views
0

Я изучаю пару сторонних компонентов для работы с PDF через C#. Это Aspose.pdf.net и iTextSharp. Ниже приведены сведения о том, что я изучаю для них:Как дублировать PDF с некоторой заменой текста и редакцией

У меня есть некоторые PDF-файлы, содержащие конфиденциальную информацию в виде текста, например, имя человека, город и т. Д. Эти PDF-файлы необходимо дублировать в другую копию, но в то время как создавая дублируемую копию, нужно искать чувствительный текст & заменен на какой-то фиктивный текст. Замена необходима, чтобы избежать отслеживания исходной информации любыми мошенническими средствами. Кроме того, замененный текст требует редактирования.

Поиск текста, который, как ожидается, будет поддерживать RegEx, поскольку могут быть изменения текста, которые необходимо замаскировать.

Не могли бы вы помочь мне, как это можно сделать с помощью iTextShart.

Заранее спасибо.

+0

iTextSharp способен выполнять полную редакцию (как визуальные, так и данные, хранящиеся в pdf) с использованием модуля PdfSweep (http://itextpdf.com/itext7/pdfsweep). Я напишу ответ, содержащий более подробную информацию. –

+0

@Jaqen. Ответ Самуэля - вариант для вас или вы ищете что-то другое. Поскольку вы не приняли этот ответ, ни комментарий, ни редактирование вашего вопроса, как указано, каким образом ответа может быть недостаточно, вам будет сложно помочь вам в дальнейшем. – mkl

+0

Спасибо @mkl, я добавил комментарий .. –

ответ

1

iTextSharp способен выполнять полную редакцию (как визуальные, так и данные, хранящиеся в pdf) с использованием модуля PdfSweep (http://itextpdf.com/itext7/pdfsweep). Для того, чтобы иметь редактирование произойдет после текстового поиска вы должны:

  1. Извлечение текста из документа (может быть сделано с помощью IText).
  2. Поиск по извлеченному тексту и получение позиции текста, который вы хотите отредактировать. (требуется реализация с вашей стороны)
  3. Используйте эти позиции, чтобы определить, где PdfSweep должен быть отредактирован. (пара строк кода)

По умолчанию PdfSweep визуально редактирует, рисуя цветные полосы над местоположениями и внутренне удаляет текст и любое изображение. Хотя технически можно использовать iText, чтобы заполнить отредактированные позиции каким-то фиктивным текстом, их реализация имеет ряд подводных камней.

PdfSweep является закрытым исходным модулем для iText7, вы можете обратиться в нашу торговую группу за дополнительной информацией о лицензировании.

+0

Спасибо Samuel за отзыв. Я загрузил пробную версию для iText7 для .net. Но я не нашел возможности использовать PdfSweep. Нужно ли его загружать отдельно? Пожалуйста помогите. –

+0

PdfSweep - закрытый модуль, для которого требуется отдельная лицензия. Сейчас у нас нет пробной версии так же, как и для ядра iText7, но вы можете связаться с нашим отделом продаж через: http://itextpdf.com/request-a- quote –

+0

Спасибо, Самуэль за информацию. –