2013-04-05 4 views
1

Я пытаюсь прочитать текст с изображения с помощью tessnet2 в приложении C#. Это мой код:Tessnet2 OCR возвращает только числа

string valoare=""; 
lblOCR.Text = ""; 

Bitmap image = new Bitmap(@"C:\Stamp\test.png"); 
tessnet2.Tesseract ocr = new tessnet2.Tesseract(); 
ocr.Init(@"F:\Manipulare pdf\bin(1)\Release32\tessdata", "eng", false); 
var rect = new System.Drawing.Rectangle(); 
List<tessnet2.Word> result = ocr.DoOCR(image, rect); 

int lc = tessnet2.Tesseract.LineCount(result); 
foreach (tessnet2.Word word in result) 
{ 
lblOCR.Text += word.Text+" "+word.Confidence+"<br/>"; 
} 

Приведенная строка содержит только цифры, но моя картина содержит буквы, и я не понимаю, почему.

Спасибо

+0

может иметь какое-то отношение к ориентации изображения? Я не уверен, что они реализовали «автоматическую» ориентацию для оболочки C#, я знаю, что это в источнике C++ .... – devHead

ответ

0

попробуйте поставить языковой пакет.

Tessnet2 работает с языковым пакетом 2 и выше.

+0

Это сделало трюк, спасибо. – roroinpho21