3

Мое понимание: дескриптор SIFT использует гистограмму градиента ориентации, рассчитанную из 16x16 пикселей окрестности. Площадь 16x16 в большом изображении может быть очень небольшой площадью, например. 1/10 одного волоса на кошачьей лапе, , когда вы изменяете размер целевого изображения на небольшой размер, 16x16 вокруг одной и той же ключевой точки может быть большой частью изображения, например. лапа кошки Мне не имеет смысла сравнивать исходное изображение с измененным размером изображения с использованием дескриптора SIFT, Может ли кто-нибудь сказать мне, что случилось с моим пониманием?Почему дескрипторы SIFT являются масштабными инвариантами?

ответ

5

Это грубое описание, но должно дать вам представление о подходе.

Одним из этапов, используемых SIFT, является создание пирамиды масштабов изображения. Он будет уменьшаться и сглаживаться с использованием фильтра нижних частот.

Детектор функции затем работает, обнаруживая функции, которые имеют пиковый отклик не только в пространстве изображения, но и в пространстве масштаба. Это означает, что он находит масштаб изображения, который функция будет давать наивысший ответ.

Затем дескриптор рассчитывается в этом масштабе. Поэтому, когда вы используете меньшую/большую версию, она все равно должна найти тот же масштаб для этой функции.

 Смежные вопросы

  • Нет связанных вопросов^_^