2015-05-19 8 views
0

Я пытаюсь обнаружить текст на отсканированной странице и получить его координаты. См. Прикрепленное изображение для примера отсканированной страницы.Обнаружить текст на отсканированной странице

Мне нужны вертикальные координаты для разделения страницы из бесполезных частей, а затем обнаружение координат текста.

Какие инструменты я мог бы использовать для разделения и обнаружения координат текста?

Example of scanned page

+0

Возможный дубликат [Алгоритм обнаружения наличия текста на изображении] (http://stackoverflow.com/questions/4606274/algorithm-to-detect-presence-of-text-on-image) –

ответ

2

Посмотрите на Stroke Width Transform.
См. Также this SO answer.

+0

+1, thank вы за то, что указали мне на «Stroke wifht Transform», я посмотрю на это. Однако в этом случае картины не снимаются на улице, в естественной сцене, а берут на стол с почти той же границей и почти одинаковой позицией. SWT может интерпретировать текст в левой части страницы в моем примере, и это неверно. Я дам ему попробовать. Спасибо – Tenaciousd93

+0

"fast"? В любом случае, если вы знаете, где находится страница, вы можете найти белые поля. Текст будет внутри полей. –

+0

Извините, я имею в виду «почти». Я не знал правильной позиции текста, но знаю, что он всегда будет на левой или правой странице, как на прилагаемом изображении. Я попробую программное обеспечение Scan Tailor, которое разбило изображение и обнаружило текст довольно хорошо. Я хотел бы знать, есть ли какие-то алгоритмы, которые я мог бы реализовать в рабочем процессе, чтобы получить координаты текста. – Tenaciousd93