2016-12-07 12 views
2

Я пытаюсь обработать это изображение на доске Я записал с помощью tesseract, но мне не повезло. Я думал о предварительной обработке, чтобы помочь улучшить наши результаты, но я не уверен, какие методы вызывать . этоTesseract & OpenCV - Обработка изображения

Вот образ у меня есть:

enter image description here

А вот tesseract команды я бегу:

convert 468.jpg -bordercolor black -border 20x20 468-b.jpg 
tesseract 468-b.jpg - -psm 11 

Обратите внимание, что он не должен правильно обрабатывать все математические символы, но, по крайней мере, получить 1 + 4 = 5 и, возможно, 2 x 12 = 24 x 1.

У меня была предыдущая фотография, которая хорошо работала с использованием только этих команд. Вот фото:

enter image description here

А вот результаты было бы выплюнуть:

I+I 

2+2m 

Это не идеально, но это было гораздо лучше, чем я получал раньше. Как я могу улучшить результаты моего нового вида на доске? Мне нужно использовать OpenCV ли, и если да, то пример реализации будет очень, очень полезно

Заранее спасибо

P.S. Здесь был мой первоначальный вопрос я задал на Tesseracts GitHub, что приведет меня к лучшим результатам:

https://github.com/tesseract-ocr/tesseract/issues/468

ответ

3

тессеракт не может распознать почерк изображение хорошо. Поэтому я думаю, что вы должны использовать глубокое обучение для распознавания образов почерка.

Вот некоторые учебник вы заинтересованы в.

https://www.tensorflow.org/versions/r0.12/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners

+1

также [это] (http://www.juergenwiki.de/notes/machine_learning_reading_in_mnist_dataset.html) может быть полезным – sturkmen