Мое понимание: дескриптор SIFT использует гистограмму градиента ориентации, рассчитанную из 16x16 пикселей окрестности. Площадь 16x16 в большом изображении может быть очень небольшой площадью, например. 1/10 одного волоса на кошачьей лапе, , когда вы изменяете размер целевого изображения на небольшой размер, 16x16 вокруг одной и той же ключевой точки может быть большой частью изображения, например. лапа кошки Мне не имеет смысла сравнивать исходное изображение с измененным размером изображения с использованием дескриптора SIFT, Может ли кто-нибудь сказать мне, что случилось с моим пониманием?Почему дескрипторы SIFT являются масштабными инвариантами?
3
A
ответ
5
Это грубое описание, но должно дать вам представление о подходе.
Одним из этапов, используемых SIFT, является создание пирамиды масштабов изображения. Он будет уменьшаться и сглаживаться с использованием фильтра нижних частот.
Детектор функции затем работает, обнаруживая функции, которые имеют пиковый отклик не только в пространстве изображения, но и в пространстве масштаба. Это означает, что он находит масштаб изображения, который функция будет давать наивысший ответ.
Затем дескриптор рассчитывается в этом масштабе. Поэтому, когда вы используете меньшую/большую версию, она все равно должна найти тот же масштаб для этой функции.