Я использую Tesseract OCR (через pytesser) и PIL (Библиотека изображений Python) для автоматического тестирования приложения.Как дать лучший шанс на успех программного обеспечения OCR?
Я проверяю, что отображаемый текст в порядке, сделав снимок экрана и получив текст благодаря tesseract.
У меня были некоторые проблемы в начале и, похоже, они улучшались, так как я увеличил размер снимка экрана благодаря бикубической интерполяции PIL.
К сожалению, у меня все еще есть некоторые ошибки, такие как путаница между «0» и «O». Я могу представить, что у меня будут другие подобные проблемы в будущем.
Я хотел бы знать, есть ли какие-то методы для подготовки изображения, чтобы помочь OCR. Любая идея приветствуется.
Заранее спасибо
Если этот вопрос по-прежнему актуален: Имеет ли это быть Тессеракт? Существуют OCR-движки (такие как ABBYY), которые отлично подходят для низкокачественных входных изображений и автоматически выполняют предварительную обработку изображений для вас. Существует REST API для OCR, который использует движок ABBYY по адресу http://www.wisetrend.com/wisetrend_ocr_cloud.shtml - у него есть бесплатная пробная версия, поэтому вы можете попробовать несколько изображений для себя –