Я успешно выполнил разделение по окружности с помощью функции pam (пакет кластеров в R), и теперь я хотел бы использовать результаты для атрибуции новых наблюдений ранее определенные кластеры/медоиды.PAM Clustering - использовать результаты в другом наборе данных
Другой способ поставить проблемы является, учитывая к кластеры/medoids, которые были найдены в РАМ функции , которая ближе к дополнительному наблюдению, которое не было в исходном наборе данных?
x<-matrix(c(1,1.2,0.9,2.3,2,1.8,
3.2,4,3.1,3.9,3,4.4),6,2)
x
[,1] [,2]
[1,] 1.0 3.2
[2,] 1.2 4.0
[3,] 0.9 3.1
[4,] 2.3 3.9
[5,] 2.0 3.0
[6,] 1.8 4.4
pam(x,2)
Наблюдение 1, 3 и 5, и 2, 4 и 6 сгруппированы вместе и наблюдение 1 и 6 является medoids:
Medoids:
ID
[1,] 1 1.0 3.2
[2,] 6 1.8 4.4
Clustering vector:
[1] 1 2 1 2 1 2
В настоящее время, к которому кластеру/медоид у должен быть отнесен /связан с?
y<-c(1.5,4.5)
О, и в случае, если у вас есть несколько решений, время вычисления имеет значение в большом наборе данных, который у меня есть.
Вы можете рассчитать расстояние от медианы у и которые когда-либо расстояние меньше. Y будет принадлежать этому кластеру. –
Вам не нужна библиотека для вычислений 'which.min' и расстояния. ** Просто напишите эту * одну строку * кода самостоятельно! ** –