В рамках проекта прогнозирования спроса я хотел бы определить лучший способ группировать временные ряды, имеющие сходство друг с другом, поэтому я могу применить алгоритм прогнозирования сверху вниз. На данный момент мой ключевой вопрос состоит в том, чтобы определить, каковы соответствующие группы и какова соответствующая иерархия этих групп. После некоторого чтения я считаю, что Dynamic Time Warping может помочь. Чтобы проверить это, я создал небольшой тестовый пример, но у меня есть одна проблема, и именно так я могу извлечь иерархию, например, в текстовое дерево или что-то подобное. Я надеюсь, что, возможно, один из вас сможет мне помочь.Извлечение древовидной структуры в тексте из hclust в R
Я создал следующий случай, чтобы продемонстрировать, что я получаю.
sc2 <- read.table("http://dl.dropbox.com/u/9641130/R/hclust.data", header=F, sep="")
SampleLabels <- c("ID1", "ID2", "ID3", "ID4", "ID5", "ID6", "ID7", "ID8", "ID9", "ID10", "ID11", "ID12", "ID13", "ID14", "ID15")
distMatrix2 <- dist(sc2, method="DTW")
hc2 <- hclust(distMatrix2, method="average")
# show the visual tree
plot(hc2, labels=SampleLabels)
Так или иначе, я хотел бы получить имена и члены кластеров в тексте, так что я могу продолжать работать с ним. У кого-нибудь есть идея?
Спасибо!
Как я понимаю, вам нужно выбрать, где вы хотите, чтобы срубить дерево ('numgroups')? Затем получите группы с чем-то вроде: 'groups = cutree (hc2, k = numgroups)'. Это дает групповые задания. Не знаете, что еще вы хотели бы. – Seth