2017-02-01 11 views
0

У меня есть элемент item item (1877 x 1877). Значения в матрице представляют собой количество раз, когда два элемента происходили вместе. Как определить сходство между двумя элементами? Через чтение я нашел несколько вариантов. Однако я не уверен в этих подходах. Приветствуются любые входные данные для начала работы.Как вычислить сходства на основе матрицы совпадения?

  1. Использование косинус для вычисления сим между двумя векторами
  2. превратить это в виде графика, использовать меры, такие как simrank для вычисления подобия - могут использовать рассчитывать возникновение как вес между двумя узлами.

ответ

0

Вы можете нарисовать его как 1877 единиц с 1877 функциями каждый. Если два элемента похожи, то они будут похожи друг на друга. Учитывая, что вы можете использовать NearestNeighbors, чтобы найти ближайший. Доступны показатели.

Кроме того, вам могут помочь переработка данных. Я не знаю, что это дистрибутив, но вы можете нормализовать значения в диапазоне [0; 1] или делать это так.

+0

Если я получу вас правильно, я использую косинус для вычисления sim между столбцами в моей матрице? столбцы рассматриваются как функции. Что касается нормализации, ссылаетесь ли вы на масштабирование каждого столбца на длину 1? из sklearn.preprocessing import *; normalized_X = нормализовать (X, ось = 0, норма = 'l1') – kitchenprinzessin