2014-10-25 5 views
0

Я установил тессеракта OCR двигатель в моих Windows XP SP3 desktop.I теперь пытаюсь запустить двигатель из командной строки, как советовали здесь https://code.google.com/p/tesseract-ocr/wiki/ReadMeКак запустить tesseract из командной строки в windows xp?

Команда они получили в тессеракт ImageName outputbase [-l Ланг] [-psm pagesegmode] [CONFIGFILE ...]

тессеракт myscan.png из

Я пытаюсь прочитать файл с именем CSE_Curriculum поэтому моя команда выглядит следующим образом

тессеракта CSE_Curriculum.pdf из

Но это дает мне следующую ошибку

не может открыть файл: CSE_Curriculum.pdf

Мой инсталлятор включает в себя данные поезда, так что это проблема? Какими должны быть соответствующие командные строки и где я должен поместить свой файл. Я проверил его, сохраняя его в документах, на рабочем столе, а также на документах и ​​настройках.

+0

Какие форматы изображений он поддерживает? –

ответ

0

Tesseract не поддерживает чтение PDF-файлов из коробки. Сначала вам нужно преобразовать его в поддерживаемый формат изображения.