2015-11-13 1 views
2

Я использую wkhtmltopdf на OS X, и, хотя он, как правило, работает по назначению, размер файлов, которые он создает, больше, чем я надеялся. Моя цель состоит в том, чтобы существенно сохранить скриншот веб-страницы текстового контента в формате pdf, и я действительно не забочусь о изображениях, гиперссылках и других функциях на странице. Я использовал этот инструмент в сочетании с pdftk, чтобы сохранить первую страницу сайта в формате PDF, а ниже приведен пример моего кода для нужной страницы (http://espn.go.com/mens-college-basketball/boxscore?gameId=400589702):Любые трюки для использования в wkhtmltopdf и pdftk для уменьшения размера файла?

/usr/local/bin/wkhtmltopdf http://espn.go.com/mens-college-basketball/boxscore?gameId=400589702 --zoom 0.65 /Users/dwm8/Desktop/test.pdf 
/usr/local/bin/pdftk /Users/dwm8/Desktop/test.pdf cat 1 output /Users/dwm8/Desktop/test2.pdf dont_ask 

Размера окончательный файл test2.pdf составляет 487 КБ, что больше, чем я предпочел бы. Есть ли какие-либо трюки, которые я могу использовать в wkhtmltopdf или pdftk, чтобы уменьшить размер файла? Спасибо за помощь!

ответ

1

Ну, если вы не заботитесь о гиперссылок или изображений, то очевидно, что нужно сделать, это подавить их с помощью --disable-external-links и --no-images. Если вы действительно заинтересованы только в тексте, который является черным и белым, вы можете также только генерировать полутонового PDF тоже:

/usr/local/bin/wkhtmltopdf --disable-external-links --no-images --zoom 0.65 --grayscale http://espn.go.com/mens-college-basketball/boxscore?gameId=400589702 result.pdf 

который получает размер файла вниз от 500Кб до 70kb на моей системе - довольно полезная экономия пространства на 86%!

+0

Ничего себе, это прекрасно работает, большое вам спасибо! Это именно то, что я искал. – dwm8

+0

Мое удовольствие - удачи! –

-1

Вы можете передать --lowquality true, так как это используется для сжатия сгенерированного формата PDF.

Дополнительная информация о параметрах можно найти здесь http://wkhtmltopdf.org/usage/wkhtmltopdf.txt

+0

'--lowquality' используется без' истины'. –

 Смежные вопросы

  • Нет связанных вопросов^_^