2013-12-20 1 views
0

Я использую ImageMagick для преобразования цифрового файла PDF в tiff. Я использую Tesseract для сканирования небольшой части этого документа, который является числом. Мои цифровые документы имеют плохое определение, а иногда tesseract не умеет читать правильный номер. Например, он читает: 5550002845 номер, который вы видите на картинке.ImageMagick лучшие улучшения для чтения номеров (с Tesseract)

enter image description here

Эта фотография была извлечена из PDF с помощью следующей команды:

convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff 

Есть ли что-нибудь лучше, я могу сделать, чтобы улучшить качество изображения (детектирования Тессеракт)?

С уважением

ответ

0

-noise 7 сделал трюк для этого одного