tm - Отличная библиотека

tm

-2зной

1ответ

Я работаю в текстовой обработке с испанскими twitts, моя проблема в том, что у меня есть те же слова, но разными способами (с акцентом и без акцента), например: accion, acción. Я пытался использовать

2зной

2ответ

Как удалить слова не в шапках в R?

Я занимаюсь анализом текста с использованием R. Есть ли способ удалить все слова, не входящие в колпачки, используя tm или stringi? Если я что-то вроде этого Albert Einstein went to the store and saw

2зной

1ответ

Поиск ключевых терминов (Корпус) в другой в R

Я задал этот вопрос раньше и получил отрицательную обратную связь, потому что я не предоставлял код. Я целый день пытался и пытался, и теперь я застрял в проблеме. Этот код был выбран пользователем в

3зной

1ответ

Как создать матрицу терминов, которая суммирует числовые значения, связанные с каждым документом?

Я немного новичок в R и tm, так что борюсь с этим упражнением! У меня есть описание столбец с беспорядочными неструктурированными данными, содержащими слова об имени, городе и стране заказчика. И еще

0зной

1ответ

stemCompletion error with r tm package

Я использую пакет tm в r. Все работает правильно, пока я не включу stemCompletion. Я получаю следующее сообщение об ошибке: Error in grep(sprintf("^%s", w), dictionary, value = TRUE) : invalid re

0зной

2ответ

установить кодировку для чтения текстовых файлов в tm Corpora

Загрузка куча документов с использованием tm Corpus Мне нужно указать кодировку. Все документы закодированы в кодировке UTF-8. Если openend через содержимое текстового редактора одобрен, но содержимое

1зной

1ответ

Word Association In R

Я ищу решение/библиотеку или любую функцию, которая находит наиболее часто встречающиеся ассоциации слов в абзаце. Например: Это дерево дает красное яблоко. Бананы желтые. Яблоко, которое я съел, было