У меня есть список сотен строк темы электронной почты. Для каждой строки темы у меня есть значение по электронной почте (открытая электронная почта/отправленная электронная почта). Например: list of subject linesКак отделить слова от предложений и сделать среднее? Текстовая обработка с помощью R
Я хочу понять, есть ли влияние на некоторые слова по средней открытой ставке.
Например, может быть, если я напишу в строке темы письма слово «Спасибо», то ставка по электронной почте будет выше.
Если я правильно понимаю логические шаги, мне нужно создать список всех слов, которые находятся в строке темы для писем, и для каждого слова сделать среднее значение между всеми линиями темы. Например: average per word
Может кто-нибудь помочь мне сделать это с помощью R? Я думаю, что есть пакеты интеллектуального анализа текста, которые могут помочь.
Спасибо !!!
Посмотрите на пакет 'tm' –
Спасибо Mhairi McNeill, что-то более конкретное? – AsSAASA
Извините за краткость - это большая тема! Найдите «text mining in R» или «R tm», и вы должны найти учебник –