Создание оптимизированной/подходящей для камеры функции камеры

Я пытаюсь создать активность камеры для съемки фотографий OCR'd. Вот что я хочу сделать:Создание оптимизированной/подходящей для камеры функции камеры

Редактируемый размер окна в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровое изображение и обработана движком OCR.
Непрерывная автофокусировка (сделано)

Я использую Tesseract кстати.

Если кто-нибудь захочет указать мне на некоторые ссылки/примеры/учебные пособия, это было бы здорово.

источник

2012-01-27 Kevin D.

Можете ли вы научить меня или связать меня с некоторыми источниками, чтобы сделать изменяемый размер окна в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровое изображение и обрабатывается двигателем OCR. –

Там есть Видоискатель прямоугольник здесь:

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

источник

2012-01-28 02:45:12 rmtheis

спасибо, я расколол tess-two (который включает в себя глаза-два). Хотя я ищу менее абстрактный пример. В настоящее время проходит все связанные классы. –

Я делал что-то подобное. Прямо сейчас, я просто отправляю всю фотографию в веб-сервис и обрабатываю его с помощью OCRfeeder, который будет выполнять сегментацию на изображении и отправлять каждую часть с текстом в нее на tesseract. Таким образом, я получаю гораздо лучшую точность. Кроме того, вы можете выполнить some preprocessing to clean up the image first.

источник

2012-01-29 06:00:46 nont

Могут быть два общих подхода.

Вы можете изменить размер изображения перед отправкой его на двигатель OCR. Имейте в виду, что у используемого вами механизма Tesseract есть своего рода функция - для этого требуется некоторое пространство между символами и границами изображений, иногда больше, чем ожидалось.

Второй подход заключается в использовании распознавания на уровне поля, когда вы указываете координаты текстового блока и отправляете полное изображение в механизм OCR. Взгляните на http://www.ocrsdk.com, это облачный OCR SDK с веб-api, недавно запущенный ABBYY, он находится в стадии бета-тестирования, поэтому теперь его можно использовать бесплатно. Он имеет field level recognition methods и Android code samples. Я работаю @ ABBYY и могу предоставить дополнительную информацию о наших продуктах, если это необходимо.

источник

2012-01-30 09:43:23 Nikolay

Создание оптимизированной/подходящей для камеры функции камеры

ответ

Смежные вопросы