В том числе много ссылок и ответы от других, я думаю, что это хорошо, чтобы сделать шаг назад и обратите внимание, что есть на самом деле два основных шага для оптического распознавания символов (OCR):
- Обнаружение текста. Это название и фокус вашего вопроса, и он связан с локализацией регионов в изображении, содержащем текст.
- Распознавание текста: здесь происходит фактическое распознавание, где локализованные области изображения от обнаружения сегментируются по-характеру и классифицируются. Это также означает, что инструменты, подобные Tesseract, вступают в игру.
Теперь, есть также два общих настроек, в которых применяется OCR:
- Controlled: Это изображения, полученные со сканера или аналогичный по-природе, где целью является документ, и вещи, как перспективы , масштаб, шрифт, ориентация, согласованность фона и т. д. довольно послушны.
- Неконтролируемый/Сцена: это более естественные и в-дикие фотографии, например. те, которые взяты с камеры, где вы пытаетесь распознать уличный знак, название магазина и т. д.
Tesseract as-is наиболее применим к «контролируемой» настройке. И вообще, но для сцены OCR особенно «повторная тренировка» Tesseract будет не непосредственно улучшить обнаружение, но может улучшить распознавание.
Если вы хотите улучшить обнаружение текста сцены, см. Это work; и если вы смотрите на улучшение распознавания текста сцены, см. это work. Поскольку вы спрашивали об обнаружении, ссылка на обнаружение использует максимально стабильные экстремальные области (MSER), которые имеют множество ресурсов реализации, например. см. here.
Там также проект обнаружения текста здесь специально для Android тоже:
https://github.com/dreamdragon/text-detection
Как многие заметили, имейте в виду, что признание остается открытым исследование сложной задачей.
Если ответы были неудовлетворительными, попробуйте поднять щедрость. Если вы идете по маршруту openCV, убедитесь, что вы настроили его для камеры, которую вы будете использовать. – Shark
С tesseract у меня есть своего рода прямоугольная область, поэтому пользователь поместит область, которая будет захвачена внутри этого прямоугольника. Но при захвате изображения, если вы немного двигаетесь, результат, который вы получаете, полностью зависит от мусора. Я думаю, что tesseract не помогает мне. Не могли бы вы предоставить мне пример кода? – TharakaNirmana
Не играл с openCV со студенческих дней, так что нет, на самом деле ... но, глядя на ваш другой вопрос, лотерейные билеты, возможно, не лучшая вещь, чтобы попробовать. Попробуйте пустую белую бумагу с большим черным жирным шрифтом и работайте оттуда ... Освещение, внутренняя часть камеры, фокус - все они мешают OCR. – Shark