Я удивлен, что Tesseract делает это хорошо. С небольшим количеством тренировок вы должны быть способны правильно обучать нижний регистр «l».
Основная проблема, с которой вы сталкиваетесь, - это верхняя часть большого символа T. Горизонтальная линия распространяется на 2 (возможно, 3) других символьных ячеек, и это вызовет проблему для любого механизма OCR, когда он попытается сегментировать символы для распознавания. Обучение может помочь в этом случае.
Следующая проблема. и: очень легкие/тонкие и, возможно, удаляются с предварительной обработкой изображения до начала OCR.
В целом, единственным шансом улучшить результаты с помощью Tesseract было бы исследование обучения. Вот некоторые ссылки, которые могут помочь.
Alternative to Tesseract OCR Training?
Tesseract OCR Library learning font
Tesseract confuses two numbers
Чтобы быть справедливым, вопрос название упоминает Тессеракт подразумевающий он спрашивает, как выполнить это * с Tesseract *. – Skrylar