У меня есть куча несжатых битоновых изображений TIF. У всех из них есть водяной знак посередине. Когда я запускаю их через OCR, текст, который перекрывается с водяным знаком, не распознается. Я пытаюсь проверить, могу ли я применить некоторую очистку для удаления этих водяных знаков, чтобы распознать недостающий текст.Как удалить водяной знак из TIFF для улучшения OCR
Опять же, изображения черно-белые, но когда вы смотрите на водяной знак, он выглядит серым, так как он имеет узор черно-белых пикселей, что делает буквы в водяном знаке менее «плотными», чем обычный текст. В то же время буквы водяного знака очень большие, намного больше обычного текста.
Пример схожих изображений this (кроме этого один цветов и символы водяных знаков в моем случае много толще и больше, мои водяные знаки также намного короче: только 3 до 4 букв длина)
Кажется, что может быть какой-то фильтр очистки, который будет похож на удаление больших черных границ с изображения, кроме того, что границы «плотнее», чем водяной знак, поэтому они выглядят «более черными».
У меня есть 3 инструмента в моем распоряжении: GIMP, ImageMagick и IrfanView. Можете ли вы порекомендовать какие-либо конкретные функции любого подмножества этих инструментов, которые могли бы мне помочь?
Является ли водяной знак обозначением (например, «конфиденциальный», «черновик» и т. д.), или он специально предназначен для путаницы OCR («Копия оценки», и т.д)? – halfer
Чисто обозначение. –
OK, прохладный. Если вы увеличите яркость и контрастность (либо с помощью Gimp, либо IM), то серые артефакты могут отпасть, а черные выживут. – halfer