n-gram

    3зной

    1ответ

    Я запускаю алгоритм классификатора наивных байков через apache mahout. У нас есть возможность установить размер графа во время обучения и запуска экземпляра алгоритма. Изменение размера моего n-грамма

    0зной

    1ответ

    Я использую solr 3.5, но я столкнулся с проблемой. Что я хочу сделать, это сравнить каждую строку в файле1 с ссылкой, указанной в файле2. Но в файле1 данные не обязательно записываются правильно. Поэт

    1зной

    2ответ

    я нашел это решение на SO, чтобы обнаружить п-граммы в строке: (здесь: N-gram generation from a sentence) import java.util.*; public class Test { public static List<String> ngrams(int n, Strin

    2зной

    2ответ

    Я просто начал питать идею разбить большую группу текста на одно целое с помощью рекурсивного 2-граммного хранилища, пока осталось только одно значение. table pair { id first_parent_id (poi

    26зной

    3ответ

    Я хочу использовать ElasticSearch для поиска имен файлов (а не содержимого файла). Поэтому мне нужно найти часть имени файла (точное совпадение, нечеткий поиск). Пример: У меня есть файлы со следующим

    0зной

    1ответ

    Я использую стандартное определение Solr Ngram поле - <fieldType name="ngram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true"> <analyzer type="index"> <to

    6зной

    2ответ

    Я пытаюсь написать алгоритм (который, как я полагаю, будет опираться на методы обработки естественного языка), чтобы «заполнить» список условий поиска. Вероятно, есть имя для такого рода вещей, о кото