Возможно ли, что эти две корреляции различны?pandas spearman корреляция странная?
Панды версия 0.18.1
from pandas import Series
a = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Crystal Palace']
b = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
c = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
d = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'West Ham']
Series(a).corr(Series(b), method="spearman")
0.69999999999999996
Series(c).corr(Series(d), method="spearman")
0.8999999999999998
python 3.5.2 и anaconda 4.4.1 –
pandas должен каким-то образом ранжировать эти строки, и поэтому они классифицируются по алфавиту. Поэтому команды могут оцениваться по-разному в зависимости от того, какие другие команды присутствуют. Поэтому панды расчитывают «правильно», но это просто не операция, которую вы хотели. –
Я не статистик, но не корреляция должна быть сделана на двух сериях чисел? Что вы ожидаете от вывода? В Pandas 0.19.2 приведенный выше пример кода падает, потому что строки не являются плавающими. – nico