tm

    -2зной

    1ответ

    Я работаю в текстовой обработке с испанскими twitts, моя проблема в том, что у меня есть те же слова, но разными способами (с акцентом и без акцента), например: accion, acción. Я пытался использовать

    2зной

    2ответ

    Я занимаюсь анализом текста с использованием R. Есть ли способ удалить все слова, не входящие в колпачки, используя tm или stringi? Если я что-то вроде этого Albert Einstein went to the store and saw

    2зной

    1ответ

    Я задал этот вопрос раньше и получил отрицательную обратную связь, потому что я не предоставлял код. Я целый день пытался и пытался, и теперь я застрял в проблеме. Этот код был выбран пользователем в

    3зной

    1ответ

    Я немного новичок в R и tm, так что борюсь с этим упражнением! У меня есть описание столбец с беспорядочными неструктурированными данными, содержащими слова об имени, городе и стране заказчика. И еще

    0зной

    1ответ

    Я использую пакет tm в r. Все работает правильно, пока я не включу stemCompletion. Я получаю следующее сообщение об ошибке: Error in grep(sprintf("^%s", w), dictionary, value = TRUE) : invalid re

    0зной

    2ответ

    Загрузка куча документов с использованием tm Corpus Мне нужно указать кодировку. Все документы закодированы в кодировке UTF-8. Если openend через содержимое текстового редактора одобрен, но содержимое

    1зной

    1ответ

    Я ищу решение/библиотеку или любую функцию, которая находит наиболее часто встречающиеся ассоциации слов в абзаце. Например: Это дерево дает красное яблоко. Бананы желтые. Яблоко, которое я съел, было