Я сделал иерархический кластер для проекта. У меня есть 300 наблюдений, каждый из 20 переменных. Я проиндексировал все переменные так, чтобы каждая переменная находилась между 0 и 1, причем большее значение было лучше.Как изменить метки узлов на диаграмме дендрограммы
Для создания кластерного графика я использовал следующий код.
d_data <- dist(all_data[,-1])
d_data_ind <- dist(data_ind[,-1])
hc_data_ind <- hclust(d_data_ind, method = "complete")
dend<- as.dendrogram(hc_data_ind)
plot(dend)
Теперь метки узлов находятся в именах строк, цифры от 1 до 300 (см. Верхний рис.). Во время анализа я удалил первый столбец фрейма данных, который помечен как «география» (см. Нижний рис.), Потому что они были названиями городов в тексте и завуалировали анализ. Но мне нужно найти названия городов на кластерном участке в их правильных местах, потому что мне нужно выбрать список городов по результатам.
Какой код следует писать, чтобы вставить названия городов в столбце «География» в этот график, соответствующий их именам строк?
Как вы можете видеть из фрейма данных (внизу рис.), Все названия городов расположены в алфавитном порядке, аккуратно в порядке возрастания, точно так же, как имена строк. Я уверен, что нетрудно помещать названия городов в сюжет, я просто не могу найти его по поиску и прошу.
Пожалуйста привыкают, чтобы обеспечить воспроизводимый код, готовый для копирования-вставки работай, чтобы сделать его проще для посетителей и читателей. (Например, 'all_data' не указан, скриншоты наборов данных не помогают, поэтому результат' dput (my_data) '- это путь.) – lukeA
спасибо за совет, я буду практиковать это в будущем – Elan
[Почему не улучшите свой вопрос сейчас] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap