Я использую Abbyy FineReader для ScanSnap для распознавания нескольких отсканированных PDF-файлов. Программное обеспечение утверждает, что оно сохраняет оригинальные PDF-изображения. Размер файла PDF до OCR и пост-OCR почти идентичны, что хорошо.Как удалить сглаживание в PDF-изображениях?
После того как программное обеспечение выполнено, все изображения в формате PDF отображаются сглаживанием в Acrobat X. Навигация по страницам намного медленнее, чем раньше, и когда я увеличиваю/уменьшаю изображение, сначала обращаются к тому, что выглядит как анти- aliasing, прежде чем быстро перейти на сглаженные изображения.
Left: Scanned PDF/Right: after OCR with Abbyy
Я хотел бы получить исходные изображения без сглаживания обратно. Интересно, что когда я открываю одну страницу из сглаженного PDF-документа в Photoshop, нет сглаживания, и изображение выглядит как левое.
Мой ограниченный опыт программирования в формате PDF заставляет меня поверить, что Abbyy, вероятно, устанавливает какой-то флаг сглаживания для каждого изображения во время обработки OCR. Как отключить этот флаг?
Любые указатели на полезные идеи были бы высоко оценены.
В случае ваших образцов документов исходный файл имеет изображение в формате JPEG, в то время как файл OCR имеет один в формате JPEG2000. Остается неизвестным, отличаются ли различия в внешнем виде от Reader с использованием различных движков рендеринга или из-за фактического изменения изображения. – mkl