2012-02-25 1 views
3

Мы, как человек, может признать эти two images так же изображения:Как распознать одно и то же изображение с разным размером?

enter image description here

В компьютере, это будет легко распознать эти два изображения, если они находятся в том же размере, так что мы должны сделать сцену Preprocessing или шаг, прежде чем распознать его, например масштабирование, но если мы посмотрим глубоко на процесс масштабирования, мы будем знать, что это не эффективный способ.

Теперь, не могли бы вы помочь мне найти способ преобразования изображений в объекты, которые не имеют отношения к размеру или местоположению пикселей, для ввода метода распознавания?

Спасибо заранее.

ответ

0

У меня есть несколько идей:

  • Пусть изображение имеет несколько цветовых порогов. Таким образом, вы получаете большие областей одного цвета. Формы этих областей можно проследить с кривыми , которые являются математическими. Если вы сделаете это для большего и меньшего размера и посмотрите, соответствуют ли кривые.
  • Попробуйте определить ключевые места в этом районе. Я не знаю точно, как это работает , но вы можете найти алгоритмы обнаружения лица. В таком алгоритм есть математическое уравнение для того, как должно выглядеть лицо. Если вы определяете достаточно объектов в таких алгоритмах, вы можете определить несколько объектов на изображениях, чтобы узнать, совпадает ли объект с .
  • И вы могли бы видеть, могут ли predator algorithm могут принимать изображения нескольких размеров. Если так, ваша проблема решена.
+0

Благодарим вас за отличный ответ, но вы думаете, что он будет работать с бинарными изображениями (черно-белый)? –

+0

Я не вижу причины, почему последние 2 не будут работать. Но для первого нужно немного придать оттенкам серого. Но должно быть хорошо. Но это всего лишь грубые идеи. – SynerCoder

+0

[например, эти два изображения] (http://dl.dropbox.com/u/46565409/2.png) –

0

Похоже, вы предполагаете, что мозг человека распознает образ эффективным способом, который скорее неверен. этот алгоритм настолько сложный, что мы его не нашли. Также требуется большая часть вашего мозга для обработки визуальных данных.

Когда дело доходит до программного обеспечения, существуют некоторые масштабные (или аффинные) инвариантные алгоритмы. Одним из таких алгоритмов является нейронная сеть LeNet 5.