Я использую tesseract для преобразования документов в текст. Качество документов колеблется дико, и я ищу советы о том, какая обработка изображений может улучшить результаты. Я заметил, что текст, который сильно пикселизирован, например, сгенерированный факсимильными машинами, особенно сложно обрабатывать tesseract - по-видимому, все эти зубчатые края символов смешивают алгоритмы распознавания фигуры.Обработка изображений для улучшения точности Tesseract OCR
Какие методы обработки изображений повысят точность? Я использовал размытие Gaussian, чтобы сгладить пиксельные изображения и увидел небольшое улучшение, но я надеюсь, что существует более конкретный метод, который даст лучшие результаты. Скажем фильтр, который был настроен на черно-белые изображения, которые сглаживали нерегулярные края, а затем фильтр, который увеличивал контрастность, чтобы сделать символы более четкими.
Любые общие советы для тех, кто является новичком при обработке изображений?
И проиллюстрировано руководство о том, как это сделать: https://code.google.com/p/tesseract-ocr/wiki/ImproveQuality – iljau
Обратите внимание, что связанный скрипт выглядит только как linux. –
@ZoranPavlovic вы правы. Ссылка предназначена только для Linux. – Prashant