http://code.google.com/p/tesseractdotnet/Тессеракт 3 (OCR) - .NET Wrapper
У меня возникли проблемы с получением Tesseract работать в моем Visual Studio 2010 проектов. Я попробовал консоль и winforms, и оба имеют тот же результат. Я пришел через DLL кем-то, кто утверждает, что он работает в VS2010
:
http://code.google.com/p/tesseractdotnet/issues/detail?id=1
Я добавляю ссылку на DLL, которые можно найти в прилагаемом к сообщению 64 из приведенного выше сайта. Каждый раз, когда я строю свой проект, я получаю AccessViolationException
, говоря, что была сделана попытка прочитать или записать защищенную память.
public void StartOCR()
{
const string language = "eng";
const string TessractData = @"C:\Users\Joe\Desktop\tessdata\";
using (TesseractProcessor processor = new TesseractProcessor())
{
using (Bitmap bmp = Bitmap.FromFile(fileName) as Bitmap)
{
if (processor.Init(TessractData, language, (int)eOcrEngineMode.OEM_DEFAULT))
{
string text = processor.Recognize(bmp);
}
}
}
}
Нарушение исключения доступа всегда указывает на if (processor.Init(TessractData, language, (int)eOcrEngineMode.OEM_DEFAULT))
. Я видел несколько предложений, чтобы убедиться, что платформа решений установлена в x86
в диспетчере конфигурации и что местоположение папки tessdata завершено с завершающей косой чертой, но безрезультатно. Есть идеи?
вы можете поделиться своей полной реализацией? Кажется, я читаю противоречивые инструкции о том, как это сделать. – Roger
Не могу взять кредит, но это сработало для меня: Замените 'eng.traineddata' в папке tessdata с этим http://code.google.com/p/tesseract-ocr/downloads/detail?name=eng.traineddata. gz – Alex