2015-09-17 2 views
0

Я имею смешанную матрицу типов данных Data_string размер (947 x 41), который содержит числовые и категориальные атрибуты.Иерархический кластер с использованием матрицы несходства R

Я построил матрицу расстояний (947 x 947) с использованием функции daisy() и измерения расстояния Gower в Rstudio.

d <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10"))) 

Я применил иерархический кластер, используя матрицу несходства (d).

# hclust 
hc <- hclust(d, method="complete") 
plot(hc) 
rect.hclust(hc, 4) 
cut <- cutree(hc, k = 1:5) 
View(cut) 

#Diana 
d_as <- as.matrix(d) 
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE) 
print(DianaCluster) 
plot(DianaCluster) 

Следующие участки, которые у меня были.

Diana_plot

hclust_plot

** Примечание: Я не мог загрузить изображение здесь, так как у меня нет достаточного количества очков РЕПУТАЦИИ в.

Я изо всех сил, чтобы понять результаты, может кто-нибудь пожалуйста

1- предложить какое-либо решение, которое я могу применить в R, чтобы упростить понимание моих результатов.

или

2-, как я могу связать его с моим исходным данным, поскольку все результаты основаны на матрице несходства.

+0

Прочитайте книгу о методах кластеризации? Или см. [Эту ссылку] (http://www.stat.berkeley.edu/~s133/Cluster2a.html) или [это] (http://iasri.res.in/ebook/win_school_aa/notes/cluster_analysis_usingr.pdf), чтобы вы начали. – ekstroem

+0

Большое вам спасибо, я понял, что сюжет будет беспорядочным для понимания, поэтому я использовал функцию «cutree», чтобы получить список кластеров вместо дерева. – user3895291

ответ