n-gram

    0зной

    1ответ

    Я использую NGramFilterFactory. Моя схема, как указано ниже <fieldType name="c_text" class="solr.TextField"> <analyzer type="index"> <tokenizer class="solr.WhitespaceTokenizerFactory"/> <fi

    2зной

    2ответ

    У меня есть список униграмм (одно слово), битрам (два слова) и триграммы (три слова), которые я вытащил из кучки документов. Моя цель - статистический анализ отчета, а также a поиск Я могу использоват

    3зной

    1ответ

    Я пытаюсь использовать NGramFilterFactory в Solr (используя Sunspot in Rails), чтобы найти похожие заголовки. Мне удалось добавить новое поле в мою SOLR schema.xml как следующим образом: <fieldType na

    1зной

    3ответ

    Я тренирую модель n-грамм на корпусе Брауна, используя nltk.ngram.NgramModel. Это занимает в основном навсегда и использует много системной памяти. Мне было интересно, есть ли способ сохранить модель,