Нежелательные результаты при использовании Tesseract OCR и tess-two

У меня было разработано приложение OCR с использованием TCR-библиотеки Tesseract и описано в следующих ссылках.Нежелательные результаты при использовании Tesseract OCR и tess-two

Но я получаю нежелательные данные, как результаты иногда. Может ли кто-нибудь помочь мне, что делать дальше, чтобы получить точные результаты.

источник

2016-08-31 emil philip

Вы должны предоставить достаточно информации для воспроизведения вашей проблемы. Пример изображения, что ожидается, что на самом деле происходит. С наилучшими пожеланиями. – YakovL

Вы должны предоставить тестовые изображения, если вы хотите, чтобы получить конкретную помощь для вашего дела, а также любой код, который вы используете, но общее правило для получения точных результатов являются:

Используйте высокий разрешение изображения (при необходимости) 300 DPI минимально
Убедитесь, что нет тени или изгибается в изображении
Если есть перекос, вам нужно будет фиксировать изображение в коде до OCr
Используйте словарь, чтобы помочь получить хорошие результаты
настроить размер шрифта (12 пт шрифт идеально)
Binarize изображение и использовать алгоритмы обработки изображения для удаления шума

Помимо всего прочего, есть много функций обработки изображений, которые могут помочь повысить точность в зависимости от вашего изображения, такого как коррекция, коррекция перспективы, удаление линии, удаление границ, удаление точек, удаление пятен, и многое другое в зависимости от вашего изображения.

источник

2016-09-03 19:22:38 hcham1

Привет @ hcham1, Спасибо за вашу ценную информацию. Но не могли бы вы также рассказать мне хороший учебник для такого рода обработки изображений? –

Я обновил свой ответ ссылкой на учебник по различным командам обработки изображений, которые могут помочь с OCR – hcham1

Нежелательные результаты при использовании Tesseract OCR и tess-two

ответ

Смежные вопросы