2015-03-12 1 views
1

Я извлек некоторые твиты и поместил их в матрицу терминов документов. Затем я начал искать ассоциации слов - слова, которые чаще всего встречаются вместе.Как визуализировать результат findAssocs() из tm

tweets_tdm <- TermDocumentMatrix(tweets_corpus)

findAssocs(tweets_tdm, 'stackoverflow', 0.20)

Я получаю результаты, которые выглядят как:

programming 0.33 java 0.27 moderator 0.27

Как можно визуализировать эти результаты отдельно от делать гистограмму/круговую диаграмму? Я хотел бы сделать визуализацию, которая содержит слово поиска «stackoverflow» в качестве оси/hub и связанных слов в качестве узла или спиц.

ответ

2

Вот перспектива использования пакета igraph и одной версии возможного выхода. Разумеется, для форматирования существует больше вариантов.

terms <- c("programming", "java", "moderator", "extraword") 
probs <- c(0.33, 0.27, 0.27, .55) 
df <- data.frame(terms = terms, probs = probs) 
g <- graph.data.frame(df, directed = TRUE) 
plot(g) 

enter image description here

 Смежные вопросы

  • Нет связанных вопросов^_^