Я ищу способ определить самые «разные» или «узнаваемые» символы N ASCII ... Например, если N = 10, то какие будут самые разные N символов в ASCII-наборе от 0x21 до 0x7E? Очевидно, что символ «X» сильно отличается от «O» (буква), но «O» (буква) очень похож на «0» (ноль). Предполагая ограниченное подмножество символов OCR, такое, что ноль и буква O будут обнаружены только как один или другой, и не нужно было беспокоиться о том, был ли он нулем или буквой O, что было бы самым разным N символы, которые типичные двигатели OCR (например, Tesseract) легко распознают из плохого качества входного изображения? Предположения. такие как «+» и «t», могут ошибочно приниматься за друг друга. могут быть сделаны, и, следовательно, каждый входной символ, будь то «+» или «t», будет соответствовать только одному или другому.OCR - большинство «разных» или «узнаваемых» символов ASCII?
Спасибо, Бен
Я думаю, что выбор персонажей будет зависеть от метода их распознавания. почему ты хочешь сделать это? – Amok
На самом деле, я думаю, что это будет больше зависеть от FONT, чем что-либо еще ... –
Также не очень полезно задать вопрос для отдельных отдельных букв, так как ошибки OCR часто путают «d» с «cl», «m» с «rn» и т. д. – ShreevatsaR