2016-04-23 4 views
3

Я новичок в текст extraction.when я пытаюсь извлечь текст из PNG изображения с помощью pytesseract вpytesseract, WindowsError: [Error 2] Система не может найти указанный файл

from PIL import Image 
import pytesseract 
s=Image.open('d:\\test.png') 
print(pytesseract.image_to_string(s)) 

я получаю сообщение об ошибке, как enter image description here Это проблема изображения (test.png). Test.png - это изображение номерной таблички. Мне нужно установить что-нибудь еще.

+0

Можете ли вы отделить вызов Image.open() от вызова image_to_string, чтобы увидеть, где ошибка возникает? – tobspr

+0

@tobspr Пробовал, но все равно получал ту же ошибку – Emmanu

+0

То, что ожидалось, вопрос в какой строке вызывает ошибку – tobspr

ответ

5

по PyPi information есть приработок, что вам не хватает:

Install google tesseract-ocr from http://code.google.com/p/tesseract-ocr/ . You must be able to invoke the tesseract command as "tesseract". If this isn't the case, for example because tesseract isn't in your PATH, you will have to change the "tesseract_cmd" variable at the top of 'tesseract.py'.

, и эта ссылка перенаправляется меня https://github.com/tesseract-ocr/tesseract

Я откровенно разочарован тем, что пакет не дает вам более информационное сообщение о том, что вам это не хватает, в любом случае, как только вы установили базовую команду tesseract, pytesseract должен работать правильно :)

+2

@it work.Thanks.I установлен tesseract-ocr из https://sourceforge.net/projects/tesseract-ocr-alt/files/ – Emmanu