2016-08-02 12 views
0

У меня есть 690 предложений собственный термин список 500 слов,Как я могу создать матрицу терминов документов с моим собственным списком терминов?

Так что я хочу сделать термин Document матрицу, как:

enter image description here

Я пытался использовать DocumentTermMatrix в tm пакетах, но Я не могу найти способ сделать список собственных слов матрицы. Что мне делать? Или какие пакеты или функции вы рекомендуете?

ответ

0

Определите свой собственный вектор стоп-слов, затем удалите все условия, которые находятся в этом векторе.

Основная идея:

mystopwords <- setdiff(unique(Terms(mydtm)), mywordvect) 

mycorpus <- tm_map(mycorpus, removeWords, mystopwords) 

(конвертировать mycorpus для усиления DTM ...)

Вы должны узнать о деталях самостоятельно.