Я в большой путанице. Можно ли найти основное предложение или подстроку (с помощью набора упражнений) в предложении. Я разбираю вакансии и пытаюсь создать текстовое приложение, которое может решить, какие навыки упомянуты в тексте. Да, возможно, это задача для какого-то глобального поиска текста с помощью словаря умений, но мне очень любопытно, может ли NN помочь? Как вы поняли, я новичок в ML.Как найти основную часть подстроки с помощью нейронных сетей?
ответ
Word2Vec является основным применением нейронных сетей, которые могли бы помочь создать численное представление слов , которые вы могли бы использовать для построения умной интерпретации ваших предложений.
Более интересно, используя LSTM, можно обрабатывать контекст и идентифицировать ключевые слова в предложениях, как в этой статье: http://www.clsp.jhu.edu/~guoguo/papers/icassp2015_myhotword.pdf. Это документ по определению ключевых слов в предложениях, позволяющий использовать более быстрые и полезные приложения программного обеспечения для распознавания голоса. Вот github: https://github.com/MajerMartin/lstm-dtw-keyword-spotting. Это слишком сложно объяснить в этом посте, но это должно занять вас и заставить вас начать обучение нейронной сети для идентификации ключевых слов.
Короткий ответ: NNs не может помочь.
Долгий ответ: Может быть, они могут, если вы действительно, ДЕЙСТВИТЕЛЬНО хотите, чтобы у них было много времени и навыков. Проблема в том, что нейронные сети используются для обработки чисел, а не слов. Большинство типов нейронных сетей полагаются на способность решать, находятся ли два значения близко друг к другу. Это все еще не так просто для строк в контексте языка.
Так что, если вы не хотите, чтобы провести в ближайшие несколько лет на изучение нейронных сетей, я бы искать другой подход;)
Кстати, есть действительно интересные проекты с использованием нейронных сетей и строк/языка. Возьмите это, например: http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0140866 Но, как я уже сказал, они действительно сложны и требуют много времени. – JeD
Да, но какой подход лучше подходит для машинного обучения? Я знаю о жестко закодированных правилах в НЛП, но это немного сложно, потому что мой естественный язык - русский – AxelUser
Ответ Роба кажется интересным. Хм, русский? Да, либо НЛП, либо вы можете извлечь навыки, основываясь на том, как они написаны. Нравится ли, умение всегда существительное? Можно ли их легко идентифицировать по-русски. Лично я бы использовал то, что вы уже предложили (Словарь навыков), или используйте Robs answer – JeD