Я разрабатываю приблизительную вычислительную систему. Определение того, насколько похожи два объекта - это базовая операция в такой системе.Существуют и другие полезные признаки сходства или расстояния?
Обычно в информатике и математике, сходство является синонимом расстояния между двумя объектами, но это не всегда ясно, мне в какой вид приложения используются следующие расстояния:
- коэффициент Jaccard является используется для поиска информации для ранжирования и оценки.
- косинуса сходство используется для вещественных векторов, и это используется, например, для измерения сходства между документами (даже если он не считает термин положения, но только частота)
- расстояние Хэмминга используются для двоичных векторов и он используется, например, для измерения сходства между двоичным дескриптором (например, ORB) в компьютерном зрении и обработкой изображений.
- Евклидово расстояние используется для реальных векторов и используется для измерения расстояния между двумя точками (и часто обозначается как L^2 расстояние)
- Функции ядра: в машине, изучающей некоторые функции ядра (например, ядро RBF), используются для измерения сходства, использующего трюк ядра.
Я знаю, что каждая из этих показателей определяется по-другому, но мне интересно, есть ли обзор или документ, в котором перечислены возможные приложения в области информатики для каждого из них (или других, которые я сделал не сообщать). ты можешь помочь мне с этим?
[Всестороннее обследование по измерениям расстояния/подобия между функциями плотности вероятности] (http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.154.8446), [Обзор измерений расстояния/сходства для категориальных данных] (http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6889941), [Обзор бинарных сходств и дистанционных измерений] (http://citeseerx.ist.psu.edu/viewdoc /summary?doi=10.1.1.352.6123), [Методы подобия для двоичных и числовых данных: a] (http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.212.6533) – rcpinto
Также исправление: евклидово расстояние работает для любого количества измерений, а не только 2. – rcpinto