Я хочу вычислить релевантность ключевого слова в тексте короткого описания. Каким будет наилучший подход с точки зрения эффективности и простоты внедрения. Я использую C++?Алгоритм вычисления релевантности ключевого слова для короткого текста (50 - 100 слов)
5
A
ответ
6
Простое решение: Количество вхождений слова в тексте.
Проделать хорошую работу, хотя это сложная проблема, с которой такие компании, как Google, работают уже много лет. Если возможно, вы можете захотеть взглянуть на using their technology
Для расширения, попробуйте следующее:
- Используйте словарь (например WordNet заменить все синонимы с общим словом
- Обнаружить подобные слова, используя Levenshtein distance
Это до сих пор доходит до вас. Вам нужно будет выполнить обработку естественного языка, чтобы действительно понять, что описание собирается различать между несколькими tex ts, содержащее ключевое слово, одинаковое количество раз.
3
Обратитесь к этим предыдущие вопросы переполнению стека:
Спасибо! Расстояние Левенштейна было тем, что я пытался вспомнить, да :) В моем случае мне не нужна обработка хардкора. Просто хочу дать оценку более 100 за очень короткий текст описания. – fgungor