n-gram

2зной

3ответ

Как генерировать би/три-грамм с использованием Spacy/NLTK

ввода текста всегда список имен блюдо, где есть 1 ~ 3 прилагательные и существительное Входы thai iced tea spicy fried chicken sweet chili pork thai chicken curry выходы: thai tea, iced tea spic

0зной

1ответ

Вычислить вероятность предложения без слов из словаря

Я обучил модели языка Ngram (unigram и bigram) на корпусе английского языка, и я пытаюсь вычислить вероятности предложений из непересекающегося тела. Например, учебный корпус состоит из 3-х предложени

0зной

1ответ

Как искать составное слово, используя ElasticSearch?

Я использую Elasticsearch на некоторое время, но я не могу найти анализатор, который решает этот конкретный вопрос: У меня есть документ, который содержит следующий текст: "The Harry Potter and the So

1зной

1ответ

N-граммы - не в памяти

У меня есть 3 миллиона рефератов, и я хотел бы извлечь из них 4 грамма. Я хочу построить языковую модель, поэтому мне нужно найти частоты этих 4-граммов. Моя проблема заключается в том, что я не могу

0зной

1ответ

Ngram elasticsearch

curl -XPUT 'http://localhost:9200/testsoundi' -d '{ "settings": { "analysis": { "analyzer": { "my_edge_ngram_analyzer": { "tokenizer": "my_edge_ngram_tokenizer" } },

0зной

3ответ

Есть ли способ получить несколько заказов ngram, используя NTLK вместо того, чтобы получать итерацию по генератору?

Мне нужны ngrams. Я знаю, что nltk.utils.ngrams может использоваться для получения ngrams, но на практике функция ngrams возвращает объект-генератор. Я всегда могу перебирать его и хранить ngrams в сп