Я работаю над проектом, который просит меня дать предложение по ключевому слову/ключевой фразе, основанное на описании продукта.Ключевое слово предложение Алгоритм
То, что у меня есть сейчас: Описание продукта, Категория продукта (может быть или не быть).
Что я хочу: Машинные сгенерированные ключевые слова/ключевые фразы на основе описания.
Какие исследования я сделал: (подход на основе НЛП) Эта проблема может быть разбита на два отдельных подхода.
- Не используя прошлые данные: Просто суммируя по текущему описанию
- Метода: - лексического, происходя, игнорируемые слова удаления и т.д. (Preprocessing)
- Shallow NLP (избирательный округ Синтаксического) и оставить только НП & JJ фразы ,
Это будет подход, который не использует описание, присутствующее в базе данных.
То, что я искал, - это лучший подход, который использует алгоритмы ML, а также использует данные моего прошлого описания продукта.
Я думал о применении мелкого анализа всего набора данных, а затем давал ключевые слова, встречающиеся более чем в N числе продуктов.
Какой алгоритм или подход пригодится? Как я могу использовать свои данные?
У вас есть большой набор продуктов с ключевыми словами уже на месте, которые вы можете использовать для обучения? –
Да, у меня есть ключевые слова, связанные с «некоторыми» описаниями продуктов. –