Мне нужно измерить сходство между двумя предложениями. Например:измерение семантической подобия 2 предложения
s1 = "she is good a dog "
s2 = "she is nice a heel"
мне нужно доказать, что "good"
похож на "nice"
. Для существительных и глаголов меры сходства по пути работает как этот псевдо-код:
def get max :
for loop
(wn.synset ('dog ')).path_similarity(wn.synset ('animal'))
Результат: .33
, что высокое значение, то эти слова связаны, и я могу сказать, что это похоже. Но для наречий ("nice"
и "good"
) значение .09
низкое!
Любые идеи?
ли, что должен быть код ?! – jonrsharpe
Я думаю, что ваш вопрос: «Почему хорошие и хорошие не признаются синонимами?». Возможно, вы могли бы перефразировать это так и показать нам реальный код python, который вы используете, что дает вам номер 0.09. –
Проблема нахождения семантического сходства между двумя предложениями представляется сложнее, чем найти сходство между огромными документами. https://www.hindawi.com/journals/tswj/2014/437162/. – pmuntima