Вдохновленный следующими git и video Я пытаюсь создать концептуальный поиск для своего домена, используя word2vec
в качестве фильтра синонимов для моих запросов.Извлечение наиболее важных слов из индекса Elasticsearch с использованием Node JS-клиента
Давать следующую структуру документа: (? Tf-IDF)
{
"_index": "conversations",
"_type": "conversation",
"_id": "103130",
"_score": 0.97602403,
"_source": {
"context": "Welcome to our service, how can I help? do you offer a free trial",
"answer": "Yes we do. Here is a link for our trial account."
}
}
Я хотел бы, чтобы перебрать весь индекс и извлечения слов с «высшим значительным».
Как только у меня будет список из 100 лучших слов, я создам фильтр синонимов, используя word2vec
.
Мой вопрос: как это можно сделать с помощью ES Node JS-клиента?
тс-IDF не определен для коллекции, она определена для документа. Вы закончите с частью idf, очень сомнительно, что это то, что вы ищете. –
Спасибо за ответ, можете ли вы предложить лучший подход для извлечения значительных слов из индекса? –
@ShlomiSchwartz вы можете объяснить, как ваше решение будет лучше, чем функция, уже предоставленная экспертом? – AR1