2017-02-07 10 views
1

Я пытаюсь выяснить, как вычислить ковариационную матрицу с Pandas. Я не ученый данных или финансовый парень, я просто регулярный разработчик, выходящий из своей лиги.Как вычислить матрицу ковариации с Pandas

import pandas as pd 
import numpy as np 
df = pd.DataFrame(np.random.randint(0,100,size=(252, 4)), columns=list('ABCD')) 
print(df.cov()) 

Так что, если я делаю это, я получаю такой вывод:

enter image description here

Я считаю, что количество огромно, и я ожидал, что они будут ближе к нулю. Должен ли я рассчитывать возврат до получения cov?

Кто-нибудь знает это, может объяснить это немного или указать на хорошую ссылку с объяснением? Я не мог найти ссылку на Covariance Matrix для чайников.

Привет, Жюльен

+0

эй мат, похоже, вам нужно лучше понять cov, отличная ссылка/объяснение wld be http://stats.stackexchange.com/questions/18058/how-would-you-explain-covariance-to-someone- кто-понимает-только-среднее – epattaro

+2

то, что вы могли бы искать, это корреляция (которая wld варьируется от -1 до 1), но это совершенно другая вещь. – epattaro

+2

Используйте 'df.corr' для корреляции, о которой упоминал @epattaro –

ответ

1

ковариации является мерой степени, до которой возвращается на двух активов (или любых двух вектор или матрица), перемещаются в тандеме. Положительная ковариация означает, что возврат активов движется вместе, а отрицательное ковариационное средство возвращается обратно обратно.

С другой стороны, мы имеем:

Коэффициент корреляции является мерой, которая определяет степень, в которой движение два переменных связаны. Обратите внимание, что коэффициент корреляции измеряет линейное отношение между двумя массивами/вектором/актив.

Таким образом, менеджеры prtfolio стараются уменьшить ковариацию между двумя активами и сохранить отрицательный коэффициент корреляции, чтобы иметь диверсификацию портфеля в портфеле, а уменьшение возврата одного актива не приведет к уменьшению возврата второго актива (эта последняя является отрицательной корреляцией).

Возможно, вы имели в виду коэффициент корреляции, близкий к нулю, а не ковариацию.