Я делаю упражнения Введение в Data Mining, и застрял в следующем вопросе:Какова связь между расстоянием Хэмминга и Простым Согласованным Коэффициентом?
Какой подход, Jaccard или расстояние Хэмминга, больше похож на Simple Matching коэффициента, и какой подход больше похож до косинусная мера? Объясните. (Примечание: Мера Хэмминга расстояние, в то время как остальные три меры сходства, но не позволяйте этому смутить вас.)
Я думаю, что расстояние Хэмминга похож на SMC, так как из них посмотрите на весь набор данных и сравните точки данных, похожие или несходные. Но решение этой книги выглядит так:
Расстояние Хэмминга похоже на SMC. Фактически SMC = Хэмминг расстояние/количество бит.
Решение приняло ошибку? Я думаю, расстояние Хемминга и SMC не равны друг другу, и расстояние Хэмминга плюс SMC равно 1.
Спасибо вам за разъяснение! Это так полезно для меня! – Nia