Я использую OCR Tesseract для приложения, которое я пишу. Я просто хочу распознать текст на некоторых участках с изображения, которое я получаю время от времени. Основные вызовы работают в настоящий моментРасширенное использование Tesseract OCR
tesseract::TessBaseAPI api;
api.SetPageSegMode(tesseract::PSM_AUTO); // Segmentation on auto
api.Init("/usr/local/share/","eng"); // path = parent directory of tessdata
pFile = fopen("home/myname/test.bmp","r"); // Open picture
PIX* image; // Image format from leptonica
image = pixReadStreamBmp(pFile);
fclose(pFile);
api.SetImage(image); // Run the OCR
char* textOutput = new char[512];
textOutput =api.GetUTF8Text(); // Get the text
Пока этот код работает нормально. Но в какой-то момент OCR не так точна, как хотелось бы. На самом деле я не хочу обучать новый язык для своей цели, поэтому я хотел знать, есть ли возможность повысить точность над некоторыми вызовами API? Возможно, некоторые предложения здесь! С наилучшими пожеланиями
Tobias
Если вы хотите получить больше точности, чем это, вы можете передать пороговое изображение OTSU в pixeRead(). Я передаю нормальное изображение в pixRead() прямо сейчас. передать пороговое изображение OTSU. Я разработал алгоритм для этого. , дайте мне знать, если кто-то захочет. –