2014-11-12 9 views
1

Я использую детектор функции HOG, основанный на классификации SVM. Я могу успешно извлечь номерной знак, но извлеченная номерная табличка имеет некоторые ненужные пиксели/линии, кроме номера лицензии. Мой конвейер обработки изображений заключается в следующем:Удаление дополнительных пикселов/строк с номера телефона

  1. Применение детектора HOG на черно-белое изображение
  2. Обрезка обнаруженной области
  3. Изменение размеров обрезанное изображение
  4. Применяя адаптивный порог, чтобы выделить число пластин & фильтрации фон, с использованием следующих OpenCV код

    cvAdaptiveThreshold(cropped_plate, thresholded_plate, 255,CV_ADAPTIVE_THRESH_GAUSSIAN_C, CV_THRESH_BINARY_INV,11, 9); 
    
  5. De-перекос плиты изображения

Благодаря этой ненужной информации, Тессеракт-OCR программное обеспечение путаться правильно распознать цифры. Извлеченные изображения номерных знаков выглядят следующим образом.

enter image description hereenter image description here

Как я могу фильтровать эти ненужные пиксели/строки из изображений? Любая помощь будет оценена.

+3

Как насчет размыва? Как насчет удаления небольшого контура? –

+0

Немного больше примеров было бы полезно. –

ответ

2

Вы хотите удалить все нетекстовые объекты на изображении. Для этого я предлагаю сортировать капли по области их ограничивающего прямоугольника (maxy - miny) * (maxx - minx). Проведите некоторый статистический анализ; вы знаете, что ищете объекты аналогичного размера. Как только вы определяете приблизительный размер символа, создайте большую ограничительную рамку, которая оценивает весь текст. Храните маленькие капли внутри, поэтому для вашей фотографии знак тире будет сохранен.

0

Возможно, вы, возможно, достигнете значительных результатов путем фильтрации контуров. Попробуйте найти контуры с определенным соотношением ширины и высоты, определенное количество белых пикселей с countNonZero() и т. Д. Если это не поможет, вы всегда можете попытаться реализовать алгоритм обнаружения текста, например Run Length Smoothing Algorithm (RLSA).