2012-01-27 6 views
4

Я пытаюсь создать активность камеры для съемки фотографий OCR'd. Вот что я хочу сделать:Создание оптимизированной/подходящей для камеры функции камеры

  1. Редактируемый размер окна в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровое изображение и обработана движком OCR.
  2. Непрерывная автофокусировка (сделано)

Я использую Tesseract кстати.

Если кто-нибудь захочет указать мне на некоторые ссылки/примеры/учебные пособия, это было бы здорово.

+0

Можете ли вы научить меня или связать меня с некоторыми источниками, чтобы сделать изменяемый размер окна в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровое изображение и обрабатывается двигателем OCR. –

ответ

3

Там есть Видоискатель прямоугольник здесь:

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

+0

спасибо, я расколол tess-two (который включает в себя глаза-два). Хотя я ищу менее абстрактный пример. В настоящее время проходит все связанные классы. –

1

Я делал что-то подобное. Прямо сейчас, я просто отправляю всю фотографию в веб-сервис и обрабатываю его с помощью OCRfeeder, который будет выполнять сегментацию на изображении и отправлять каждую часть с текстом в нее на tesseract. Таким образом, я получаю гораздо лучшую точность. Кроме того, вы можете выполнить some preprocessing to clean up the image first.

0

Могут быть два общих подхода.

Вы можете изменить размер изображения перед отправкой его на двигатель OCR. Имейте в виду, что у используемого вами механизма Tesseract есть своего рода функция - для этого требуется некоторое пространство между символами и границами изображений, иногда больше, чем ожидалось.

Второй подход заключается в использовании распознавания на уровне поля, когда вы указываете координаты текстового блока и отправляете полное изображение в механизм OCR. Взгляните на http://www.ocrsdk.com, это облачный OCR SDK с веб-api, недавно запущенный ABBYY, он находится в стадии бета-тестирования, поэтому теперь его можно использовать бесплатно. Он имеет field level recognition methods и Android code samples. Я работаю @ ABBYY и могу предоставить дополнительную информацию о наших продуктах, если это необходимо.

 Смежные вопросы

  • Нет связанных вопросов^_^