Я использую ImageMagick для преобразования цифрового файла PDF в tiff. Я использую Tesseract для сканирования небольшой части этого документа, который является числом. Мои цифровые документы имеют плохое определение, а иногда tesseract не умеет читать правильный номер. Например, он читает: 5550002845 номер, который вы видите на картинке.ImageMagick лучшие улучшения для чтения номеров (с Tesseract)
Эта фотография была извлечена из PDF с помощью следующей команды:
convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff
Есть ли что-нибудь лучше, я могу сделать, чтобы улучшить качество изображения (детектирования Тессеракт)?
С уважением