2016-09-28 5 views
1

Хорошо, поэтому я потратил большую часть сегодняшнего дня, пытаясь даже заставить ocr работать нормально, и он больше не сбой, но когда я даю ему файл, содержащий текст, а просто цифры много странного текста откачали ...C# Tessnet2 OCR не возвращает правильные значения atall

Исходный код:

using System; 
using System.Collections.Generic; 
using System.Drawing; 
using System.Linq; 
using System.Text; 
using System.Threading.Tasks; 
using tessnet2; 

namespace OCRTest 
{ 
    class Program 
    { 
     static void Main(string[] args) 
     { 
      try 
      { 
       var image = new Bitmap(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\testimage.jpg"); 
       var ocr = new Tesseract(); 
       ocr.Init(@"C:\Users\Ryan\Documents\visual studio 2015\Projects\OCRTest\tessdata", "eng", true); 
       var result = ocr.DoOCR(image, Rectangle.Empty); 
       foreach (Word word in result) 
       { 
        Console.WriteLine("{0} : {1}", word.Confidence, word.Text); 
       } 
      } 
      catch (Exception exception) 
      { 
       Console.WriteLine(exception); 
      } 
      Console.ReadLine(); 
     } 
    } 
} 

как я уже сказал, я использую tessnet2 вместе с англ tessdata.

Когда вход это изображение:

Test data image

Я получаю ответ от программы:

Result from program

Заранее спасибо за любую помощь или ссылки на дополнительные учебные пособия вы можете иметь - Я последовал за this учебником, чтобы получить до сих пор .. Райан

ответ

1

Fi xed проблема - я сделал глупо и установил последний параметр ocr.Init() как true, а не false ...