В How can I remove all images from a PDF? Курт Пфайфл дал фрагмент кода PostScript (любезно предоставлен Chris Liddell), чтобы отфильтровать все растровые изображения из PDF, используя GhostScript.Как удалить все, кроме растровых изображений из PDF?
Это работает как шарм; тем не менее, меня также интересует сопутствующая задача удаления всего за исключением растровых изображений из PDF и без повторного сжатия растровых изображений. Или, в конечном счете, разделение векторных и растровых «слоев». (Я знаю, это не то, что слой в терминологии PDF.)
AFAIU, фильтр Курта работает, отправив все растровые изображения на нулевое устройство, оставив все остальное до pdfwrite
. Я читал, что можно использовать разные устройства с GS, поэтому я надеюсь, что по умолчанию можно отправить все на фальшивое/нулевое устройство и только переключиться на pdfwrite
для тех изображений, которые были захвачены фильтром. Но, к сожалению, я полностью не могу перевести такую вещь в код PostScript.
Может ли кто-нибудь помочь или хотя бы сказать мне, может ли этот подход обречен на провал?
Не может помочь с решением ghostscript, если это то, что вы ищете, но я хотел сообщить вам, что есть очень элегантные решения на основе PDF, если вы можете использовать коммерческие инструменты. Если вас это интересует, я тоже могу объяснить больше. –
Спасибо, Дэвид. Действительно, я ищу, по крайней мере, инструмент для бесплатного использования в пиво для личного использования; но не обязательно. Так что что-то вроде [CoherentPDF] (http://community.coherentpdf.com/) в выпуске сообщества было бы неплохо (кстати, он отлично справляется с опцией '-draft', но ближе к вещам, уже связанным в основных дистрибутивах Linux лучше, и требуется поддержка Linux. – akobel