Я делаю кластерный анализ на основе данных «колледж», который состоит из 3 номинальных и 20 числовых переменных.Я хочу рассчитать отклонение выборки каждого столбца в данных
# select the columns based on the clustering results
cluster_1 <- mat[which(groups==1),]
#"cluster_1" is a data set which is made by cluster analysis consisting of 125 observations.
rbind(cluster_1[, -(1:3)], colMeans(cluster_1[, -(1:3)]))
#This is process of calculating each column's mean and attach the means to the bottom of the data set, "cluster_1".
Теперь то, что я хочу знать, как вычислить дисперсию выборки каждого столбца и отклонение выборки и как прикрепить их к нижней части набора данных «cluster_1».
Пожалуйста, дайте мне знать.
С точки зрения дизайна, добавление сводной статистики в нижней части вашего data.frame довольно плохо. Это означает, что теперь вы не сможете больше анализировать данные, когда они содержат яблоки и апельсины. Вам лучше держать их в отдельной структуре данных. – flodel