Я имею смешанную матрицу типов данных Data_string размер (947 x 41), который содержит числовые и категориальные атрибуты.Иерархический кластер с использованием матрицы несходства R
Я построил матрицу расстояний (947 x 947) с использованием функции daisy() и измерения расстояния Gower в Rstudio.
d <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10")))
Я применил иерархический кластер, используя матрицу несходства (d).
# hclust
hc <- hclust(d, method="complete")
plot(hc)
rect.hclust(hc, 4)
cut <- cutree(hc, k = 1:5)
View(cut)
#Diana
d_as <- as.matrix(d)
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE)
print(DianaCluster)
plot(DianaCluster)
Следующие участки, которые у меня были.
** Примечание: Я не мог загрузить изображение здесь, так как у меня нет достаточного количества очков РЕПУТАЦИИ в.
Я изо всех сил, чтобы понять результаты, может кто-нибудь пожалуйста
1- предложить какое-либо решение, которое я могу применить в R, чтобы упростить понимание моих результатов.
или
2-, как я могу связать его с моим исходным данным, поскольку все результаты основаны на матрице несходства.
Прочитайте книгу о методах кластеризации? Или см. [Эту ссылку] (http://www.stat.berkeley.edu/~s133/Cluster2a.html) или [это] (http://iasri.res.in/ebook/win_school_aa/notes/cluster_analysis_usingr.pdf), чтобы вы начали. – ekstroem
Большое вам спасибо, я понял, что сюжет будет беспорядочным для понимания, поэтому я использовал функцию «cutree», чтобы получить список кластеров вместо дерева. – user3895291