Я пытаюсь вычислить сходство между 2 предложениями, поэтому у меня есть два набора слов, каждое из которых представляет предложение, а функция (F), которая получает два слова и возвращает сходство между ними в способ .. Измерение сходства между двумя векторами
в изображении 1 черные круги слова предложения а, а красные квадраты представляют собой высказывание B. для каждой функции времени (F), получает 2 слова, он возвращает значение в диапазоне от 0.0 и 1.0, например: первое слово в A и третье из B имеют 0,3 балла подобия. Я использовал сравнение M x N, потому что порядок двух предложений часто не одинаковый, а также количество слов.
Мои вопросы:
После получения всех M х N баллов сравнения, как я мог бы получить окончательный балл в диапазоне от 0,0 до 1,0, что обозначает сходство двух предложений или списков? ", так как длина двух предложений не всегда равна".
Если этот подход неправильный, то какая альтернатива?
Интересно. Как вы определили подобное? –
Я не думаю, что это точно, что вы пытаетесь сделать. У вас есть матрица оценок сходства? Я не уверен, что должно означать сравнение M x N. Возникает вопрос, относящийся к какой-то теме «подобия» или математике? Может быть, люди, испытывающие недостаток опыта в «сходстве», все же могут оказать помощь. –
@NickZiebert, семантически используя кратчайший путь в онтологии. –