2017-02-22 23 views
0

наивный вопрос:статистика корреляции

Correlation

В прилагаемом снимке, я пытаюсь выяснить понятие корреляции применительно к фактическим значениям и расчета, выполненного на этих фактических значений и создание нового потока данные.

В примере,

Колонна A, B, C, D, E имеет очень разные корреляции, но когда я прокатную сумму на один и те же столбцы, чтобы получить G, H, I, J, K корреляции очень же (отрицательный или положительный.

ли они к различным типам корреляции или я пропускаю на что-то.

заранее спасибо !!

ответ

0

Да, это разные корреляции. это как если бы вы измеряли ускорение с течением времени o f 5 автомобилей (ваша первая часть данных) и коррелируют эти ускорения. Каждый автомобиль с течением времени ускоряется с разной скоростью, оставляя вашу корреляцию повсюду.

Ваш второй набор данных будет скоростью каждой машины в каждый момент времени. Поскольку каждый автомобиль ускоряется с довольно постоянной скоростью (и делает это в двух разных направлениях от начальной точки), вы получаете либо большую положительную, либо большую отрицательную корреляцию.

Не обязательно, чтобы вы получили эту большую положительную или большую отрицательную корреляцию во втором наборе, но поскольку ваши данные в каждом списке последовательно положительны или отрицательны и растут с постоянной скоростью, это коррелирует с аналогичными списками.

+0

Спасибо @JNevill за объяснение. Еще один быстрый вопрос: какая корреляция будет лучше понимать данные тогда? 1-й или 2-й сет. Я знаю, что лучшего ответа на этот вопрос нет, но просто любопытно. –

+0

Это зависит от данных и ваших потребностей. Я не могу себе представить, что +/- 1 действительно полезен, потому что он действительно только говорит вам направление вашей скорости изменения первого набора данных. Это может помочь, если вы построите оба набора данных и визуально увидите, почему действует корреляция. – JNevill