У меня есть Корпус в R, используя пакет tm
. Я подаю функция removeWords
для удаления игнорируемых словДобавление пользовательских стоп-слов в R tm
tm_map(abs, removeWords, stopwords("english"))
Есть ли способ, чтобы добавить свои собственные пользовательские стоп-слова в этот список?
Вместо того, чтобы делать это для каждой операции, есть файл или dict, где я могу добавить эти дополнительные стоп-слова, такие как процент, цент, миллион и т. Д.? – Pradeep