2016-08-31 10 views
0

У меня было разработано приложение OCR с использованием TCR-библиотеки Tesseract и описано в следующих ссылках.Нежелательные результаты при использовании Tesseract OCR и tess-two

  1. android-ocr
  2. tesseract

Но я получаю нежелательные данные, как результаты иногда. Может ли кто-нибудь помочь мне, что делать дальше, чтобы получить точные результаты.

+1

Вы должны предоставить достаточно информации для воспроизведения вашей проблемы. Пример изображения, что ожидается, что на самом деле происходит. С наилучшими пожеланиями. – YakovL

ответ

1

Вы должны предоставить тестовые изображения, если вы хотите, чтобы получить конкретную помощь для вашего дела, а также любой код, который вы используете, но общее правило для получения точных результатов являются:

  • Используйте высокий разрешение изображения (при необходимости) 300 DPI минимально

  • Убедитесь, что нет тени или изгибается в изображении

  • Если есть перекос, вам нужно будет фиксировать изображение в коде до OCr

  • Используйте словарь, чтобы помочь получить хорошие результаты

  • настроить размер шрифта (12 пт шрифт идеально)

  • Binarize изображение и использовать алгоритмы обработки изображения для удаления шума

Помимо всего прочего, есть много функций обработки изображений, которые могут помочь повысить точность в зависимости от вашего изображения, такого как коррекция, коррекция перспективы, удаление линии, удаление границ, удаление точек, удаление пятен, и многое другое в зависимости от вашего изображения.

+0

Привет @ hcham1, Спасибо за вашу ценную информацию. Но не могли бы вы также рассказать мне хороший учебник для такого рода обработки изображений? –

+0

Я обновил свой ответ ссылкой на учебник по различным командам обработки изображений, которые могут помочь с OCR – hcham1