2016-02-27 4 views
3

До сих пор я создал приложение ocr, используя tess-two. Чтобы создать приложение, я загрузил и построил библиотеку tess-two (спасибо rmtheis!).Как я могу обучить Tesseract на Windows 7 с помощью tess-two, загруженного и построенного?

Мне нужно улучшить вывод OCR, потому что результаты имеют уровень точности менее 20%. Я работаю только с числами (от 0 до 9), и я надеюсь достичь 100% точности.

Я загрузил ghostscript, vietocr и serak в соответствии с рекомендациями некоторых блогов, которые я прошел. Они охватывают процесс обучения более подробно, чем большинство других записей по этому вопросу. (ссылки здесь: Pradeep's Blog, reachsri site)

Мой вопрос: мне нужно снова загрузить приложение tesseact?

Некоторые шаги в обучении означают, что я буду выполнять команды, начинающиеся с «tesseract.exe», и у меня нет такого файла на моем компьютере.

Должен ли я по-прежнему загружать приложение tesseract? Или я могу работать с tess-two?

Любая помощь будет оценена по достоинству.

ответ

1

Вы можете обучить Tesseract в Windows или Linux и использовать сгенерированный файл .traineddata с tess-two. Убедитесь, что ваш инструмент включает в себя исполняемый файл обучения Tesseract.

+1

Уважаемый Nguyenq, спасибо за ваш ответ. Я хочу быть уверенным, что я правильно понимаю. Я должен загрузить приложение tesseract и установить на моем компьютере Windows 7? является ли "tesseract training executable" отдельным пакетом? – GeorgeF

+1

Да, и вам нужно будет создать учебный исполняемый файл из источника. Кроме того, они входят в некоторые учебные инструменты, такие как [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) или [другие] (https://github.com/tesseract-ocr/tesseract/wiki/аддоны). – nguyenq

+0

Спасибо, аган, извините за поздний ответ. Я сравнительно новичок в этом, поэтому, пожалуйста, помогите мне понять; есть ли какая-либо причина или преимущество для создания tesseract из источника? Почему нет окна «tesseract.exe» для окон? Я проделал некоторые поиски и с удивлением обнаружил, что не найдено (для «tesseract.exe»)! почему это? Просьба помочь со ссылкой на постоянный exe-файл, если он у вас есть, или если вы считаете, что лучше построить из источника, PLS любезно дать мне шаг за шагом. Честно говоря, я бы предпочел стоящий exe. Еще раз спасибо за ваш быстрый и полезный ответ! – GeorgeF