Обнаружить текст на отсканированной странице

Я пытаюсь обнаружить текст на отсканированной странице и получить его координаты. См. Прикрепленное изображение для примера отсканированной страницы.Обнаружить текст на отсканированной странице

Мне нужны вертикальные координаты для разделения страницы из бесполезных частей, а затем обнаружение координат текста.

Какие инструменты я мог бы использовать для разделения и обнаружения координат текста?

Example of scanned page

источник

2015-05-19 Tenaciousd93

Возможный дубликат [Алгоритм обнаружения наличия текста на изображении] (http://stackoverflow.com/questions/4606274/algorithm-to-detect-presence-of-text-on-image) –

Посмотрите на Stroke Width Transform.
См. Также this SO answer.

источник

2015-05-19 10:19:00

+1, thank вы за то, что указали мне на «Stroke wifht Transform», я посмотрю на это. Однако в этом случае картины не снимаются на улице, в естественной сцене, а берут на стол с почти той же границей и почти одинаковой позицией. SWT может интерпретировать текст в левой части страницы в моем примере, и это неверно. Я дам ему попробовать. Спасибо – Tenaciousd93

"fast"? В любом случае, если вы знаете, где находится страница, вы можете найти белые поля. Текст будет внутри полей. –

Извините, я имею в виду «почти». Я не знал правильной позиции текста, но знаю, что он всегда будет на левой или правой странице, как на прилагаемом изображении. Я попробую программное обеспечение Scan Tailor, которое разбило изображение и обнаружило текст довольно хорошо. Я хотел бы знать, есть ли какие-то алгоритмы, которые я мог бы реализовать в рабочем процессе, чтобы получить координаты текста. – Tenaciousd93

Обнаружить текст на отсканированной странице

ответ

Смежные вопросы