Я найти косинус сходство между документами .. Я сделал это тако косинус сходстве
D1 = (8,0,0,1), где 8,0,0,1 являются Tf-IDF десятки термины t1, t2, t3, t4
D2 = (7,0,0,1)
сов (тета) = (56 + 0 + 0 + 1)/SQRT (64 + 49) SQRT (1 +1)
, который выходит быть
сов (тета) = 5
Теперь, что я могу оценить из этого значения ... Я не понимаю, что значит cos (theta) = 5 означает сходство между ними ... Я делаю все правильно?
сов (theta) всегда между -1 и 1. Вы делаете что-то неправильно. Кроме того, это домашнее задание? – 2010-05-18 18:36:55
yeah ... присваивание – jaskirat