2016-12-29 4 views
1

Я пытаюсь вычислить сходство между 2 предложениями, поэтому у меня есть два набора слов, каждое из которых представляет предложение, а функция (F), которая получает два слова и возвращает сходство между ними в способ .. Image 1Измерение сходства между двумя векторами

в изображении 1 черные круги слова предложения а, а красные квадраты представляют собой высказывание B. для каждой функции времени (F), получает 2 слова, он возвращает значение в диапазоне от 0.0 и 1.0, например: первое слово в A и третье из B имеют 0,3 балла подобия. Я использовал сравнение M x N, потому что порядок двух предложений часто не одинаковый, а также количество слов.

Мои вопросы:

  1. После получения всех M х N баллов сравнения, как я мог бы получить окончательный балл в диапазоне от 0,0 до 1,0, что обозначает сходство двух предложений или списков? ", так как длина двух предложений не всегда равна".

  2. Если этот подход неправильный, то какая альтернатива?

+1

Интересно. Как вы определили подобное? –

+0

Я не думаю, что это точно, что вы пытаетесь сделать. У вас есть матрица оценок сходства? Я не уверен, что должно означать сравнение M x N. Возникает вопрос, относящийся к какой-то теме «подобия» или математике? Может быть, люди, испытывающие недостаток опыта в «сходстве», все же могут оказать помощь. –

+0

@NickZiebert, семантически используя кратчайший путь в онтологии. –

ответ

0

Я получил счет на графике выше, следующим образом:

1- Когда я получаю 2 списка, тем короче будет один на левой стороне.

2- для каждого слова в левой части я выделил max (1.0 в нашем примере), а затем разделил его на число слов с правой стороны, чтобы получить оценку для слова.

3- наконец, я подвел итоги для слов, чтобы получить окончательный результат, затем разделим его на количество слов слева. (1 + 0.8)/2 = 0.4

Этот тип расчета зависит от характера отношений, поскольку каждое слово может иметь отношения выше ZERO, но если каждое слово имеет только одно отношение выше ZERO с другими отношениями мы не должны делить итоговые оценки на количество слов на последнем шаге.

 Смежные вопросы

  • Нет связанных вопросов^_^