2014-09-04 6 views
0

Я работаю на библиотеку Тессеракт и ниже является входом для Tesseract,улучшения тессеракт и изображения предварительной обработки шаги

enter image description here

На начальном этапе реализации я использовал только «МСЗ» зона удостоверения личности. Но фактическое намерение состоит в том, чтобы отсканировать весь документ и получить все тексты в удостоверении личности.

Я прошел через this document и для улучшения качества Tesseract на первом этапе изображение должно быть 300 dpi.

1) Как конвертировать захваченное изображение камеры в формате ios до 300 dpi?

2) Каким должен быть лучший уровень контрастности и яркости для Tesseract для получения наилучших результатов?

3) Есть ли какой-либо другой этап предварительной обработки, который я могу применить к изображению, чтобы получить хорошую точность?

4) Для лучшей точности, каково рекомендуемое разрешение изображения?

5) Я использовал "int tesseract::TESSDLL_API::MeanTextConf", чтобы получить оценку доверия. С учетом этого показателя доверия для каждого персонажа есть вероятность, что я могу решить, превышает ли показатель доверия какой-то процент, то признанный персонаж является точным? Если я ошибаюсь, можете ли вы объяснить использование метода «MeanTextConf»?

+0

У вас был большой успех Tessact для обработки изображений из документов ID, таких как ваш образец? – jb007

+0

Hi, Невозможно управлять DPI, если конечный пользователь использует камеру. Проверьте информацию DPI здесь: http://en.wikipedia.org/wiki/DPI Однако это не означает, что вы не можете получить хорошие результаты OCR. После того, как пользователь поставляет изображение, вы можете выполнить автоматическую контрастность и удаление шума, чтобы улучшить качество изображения, прежде чем подавать изображение на двигатель OCR. Изображение, которое вы приложили, имеет хорошее качество, я могу получить часть MRZ, узнаваемую с помощью нашего коммерческого пакета [Asprise OCR SDK] (http://asprise.com/royalty-free-library/ocr-api- for-java-csharp-vb.net.html) –

+0

' ' –

ответ

2

Я написал несколько общих сообщений в блоге OCR по предварительной обработке изображений и «как работает OCR лучше всего». Их можно найти здесь: http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

В целом, получение достаточно высокого разрешения должно быть первым шагом. Низкое разрешение просто не имеет достаточной информации для письма, чтобы надежно читать символы. Затем я делаю адаптивную бинаризацию, где изображение преобразуется в черный & белый, используя порог, где фоны должны быть диспансерными, а символы должны оставаться довольно четкими, без лишних шумов или дыр в них. Затем, необязательно, может выполнять сегментацию в различные поля и обрабатывать каждое поле отдельно с конкретными настройками, такими как «цифры только» для числа, и «M | F» для поля пола и т. Д.

+0

Похоже, что все ваши старые сообщения ушли. – jQwierdy