n-gram

3зной

1ответ

Я запускаю алгоритм классификатора наивных байков через apache mahout. У нас есть возможность установить размер графа во время обучения и запуска экземпляра алгоритма. Изменение размера моего n-грамма

0зной

1ответ

Любое предложение, отличное от Solr n-gram

Я использую solr 3.5, но я столкнулся с проблемой. Что я хочу сделать, это сравнить каждую строку в файле1 с ссылкой, указанной в файле2. Но в файле1 данные не обязательно записываются правильно. Поэт

1зной

2ответ

быстрый способ обнаружения n-граммов в строке?

я нашел это решение на SO, чтобы обнаружить п-граммы в строке: (здесь: N-gram generation from a sentence) import java.util.*; public class Test { public static List<String> ngrams(int n, Strin

2зной

2ответ

Сжатие текста с использованием рекурсивных N-грамм

Я просто начал питать идею разбить большую группу текста на одно целое с помощью рекурсивного 2-граммного хранилища, пока осталось только одно значение. table pair { id first_parent_id (poi

26зной

3ответ

Поиск имени файла с ElasticSearch

Я хочу использовать ElasticSearch для поиска имен файлов (а не содержимого файла). Поэтому мне нужно найти часть имени файла (точное совпадение, нечеткий поиск). Пример: У меня есть файлы со следующим

0зной

1ответ

Solr ngram не соответствует количеству?

Я использую стандартное определение Solr Ngram поле - <fieldType name="ngram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true"> <analyzer type="index"> <to

6зной

2ответ

Алгоритм NLP для «заполнения» поисковых терминов

Я пытаюсь написать алгоритм (который, как я полагаю, будет опираться на методы обработки естественного языка), чтобы «заполнить» список условий поиска. Вероятно, есть имя для такого рода вещей, о кото