2013-04-07 1 views
3

Я пробовал делать это с помощью tesseract, но созданный файл apk имеет 8 МБ. Я видел приложение Goggles в Play и его довольно эффективное. Мне интересно, как интегрировать эту технику. Я не видел ни одного учебника для этого. Если кто-нибудь знает, как это сделать, ответьте.Google ocr api для android (преобразование изображения в текст)

Также как улучшить качество Tesseract, которое я использую. Преобразование является гладким, но мне интересно, если я делю изображения в нескольких частях, а затем раздельно разберусь, это будет полезно.

Требование состоит в том, что оно должно читать счета или квитанции, поэтому я хочу улучшить качество преобразования текста. Пожалуйста, предложите.

+0

Не могли бы вы немного рассказать, пожалуйста? – Sid

+0

См. Отредактированный вопрос. –

+0

Привет! Не могли бы вы рассказать мне, как построить тесс-два. Eclipse дает мне ошибку, неспособную скомпилировать. – Newts

ответ

2

Я считаю, что вы скомпилируете этот проект: tess-two. Я прав?

Если это так, вы можете значительно уменьшить размер APK, скомпилировав различные APK для конкретных архитектур процессора. Кроме того, вы можете удалить большинство функций Лептоника, поскольку они вам не нужны.

Для большей точности:

  • , если вы используете камеру телефона в качестве входных данных, вы должны изменить алгоритм бинаризации. Лептоника имеет некоторые алгоритмы бинаризации, попробуйте Sauvola.
  • Параметры настройки tesseract для лучшей производительности и скорости.
  • убедитесь, что у вас есть согласованное разрешение для всех телефонов. Где-то около 300dpi.

Если вы хотите, чтобы небольшое приложение выполнялось быстро на большинстве телефонов, рассмотрите возможность запуска OCR на сервере, а не на телефоне.

Tesseract, насколько я знаю, безусловно лучший механизм OCR, который может быть скомпилирован для Android. Он должен быть правильно настроен и снабжен хорошим изображением.

+2

Да, я компилирую tess-two, см. Проблема: она не дает точного результата с другой ориентацией, возникают проблемы с изображениями, сделанными вспышкой, также результат отличается от разных устройств. Я сравниваю свое приложение с Google Goggles, и каждый раз, когда я терплю неудачу, я просто хотел достичь точности и скорости, например, Goggles. Какая техника используется Google, она работает через Google Drive. Я реализовал Abby также , но это также занимает много времени, в 20 раз больше времени, чем то, что делает Goggle. У вас есть идея реализовать то же самое, что и Google Goggles. –

+0

Вы нашли решение? – Sheychan