tf-idf

    6зной

    1ответ

    Итак, я немного смущен. Однако это должен быть простой вопрос. После вычисления TF-IDF Матрицы Документа против всего корпуса, я получаю результат очень похож на это: array([[ 0.85..., 0. ..., 0.52...

    12зной

    1ответ

    Хорошо, так что я следовал за эти два сообщения на TF * IDF, но я немного смущен: http://css.dzone.com/articles/machine-learning-text-feature В принципе, я хочу, чтобы создать поисковый запрос, содерж

    0зной

    1ответ

    Я хотел бы, чтобы нормализовать результаты tfidf, что я получил от этого данного кода: for (int docNum = 0; docNum < ir.numDocs(); docNum++) { TermFreqVector tfv = ir.getTermFreqVector(docNum,

    3зной

    2ответ

    Может ли кто-нибудь показать простой пример реализации или использования алгоритма tf-idf в Smalltalk для обработки естественного языка? Я нашел реализацию в пакете под названием NaturalSmalltalk, но

    1зной

    1ответ

    Может ли кто-нибудь направить меня к любой научной работе относительно сравнения PageRank и временной частоты - частоты обратного документа. Я искал все, и я просто нахожу документы по объединению дву

    3зной

    2ответ

    Я внедряю инструмент классификации и экспериментировал с различными версиями TF: два логарифмических (коррекция внутри/вне логарифмического вызова), нормализованная, дополненная и средневзвешенная. По

    14зной

    1ответ

    Я пытаюсь сделать очень простой анализ текста с пакетом tm и получить некоторые оценки tf-idf; Я запускаю OS X (хотя я пробовал это на Squeeze Debian с тем же результатом); У меня есть каталог (которы