2013-11-29 4 views
0

Я делаю кластерный анализ на основе данных «колледж», который состоит из 3 номинальных и 20 числовых переменных.Я хочу рассчитать отклонение выборки каждого столбца в данных

# select the columns based on the clustering results 
cluster_1 <- mat[which(groups==1),] 

#"cluster_1" is a data set which is made by cluster analysis consisting of 125 observations. 


rbind(cluster_1[, -(1:3)], colMeans(cluster_1[, -(1:3)])) 
#This is process of calculating each column's mean and attach the means to the bottom of the data set, "cluster_1". 

Теперь то, что я хочу знать, как вычислить дисперсию выборки каждого столбца и отклонение выборки и как прикрепить их к нижней части набора данных «cluster_1».

Пожалуйста, дайте мне знать.

+0

С точки зрения дизайна, добавление сводной статистики в нижней части вашего data.frame довольно плохо. Это означает, что теперь вы не сможете больше анализировать данные, когда они содержат яблоки и апельсины. Вам лучше держать их в отдельной структуре данных. – flodel

ответ

0
rbind(cluster_1, apply(cluster_1,2,sd), apply(cluster_1, 2, var)) 
+0

Спасибо! Мне нужно знать о "применении" – user3027252