2013-02-17 5 views
0

С prcomp() функции, я оценочный процент дисперсии объяснилСобственные против PVE (процент дисперсии объяснил)

prcomp(env, scale=TRUE) 

Второй столбец summary(pca) показывает эти значения для всех ПК:

     PC1 PC2  PC3  PC4  PC5  PC6  PC7 
Standard deviation  7.3712 5.8731 2.04668 1.42385 1.13276 0.79209 0.74043 
Proportion of Variance 0.5488 0.3484 0.04231 0.02048 0.01296 0.00634 0.00554 
Cumulative Proportion 0.5488 0.8972 0.93956 0.96004 0.97300 0.97933 0.98487 

Теперь я хочу чтобы узнать, что такое Собственные значения для каждого ПК:

pca$sdev^2 
[1] 5.433409e+01 3.449329e+01 4.188887e+00 2.027337e+00 1.283144e+00 
[6] 6.274083e-01 5.482343e-01 

Но эти значения представляют собой просто альтернативное представление самого PVE. Так что я делаю неправильно здесь?

+0

Необходимо предоставить свои данные, которые дают этот результат. Что вы подразумеваете под «альтернативным представлением самого PVE»? – Arun

+0

Arun: 0.5488 * 10 - примерно 5.433. Из публикаций, которые я рассматриваю, у Собственных значений, похоже, нет таких отношений с PVE. – cryptic0

+0

Помогает ли мне понять путаницу? Изменение (или дисперсия) в каждом направлении дается каждым собственным значением. А доля дисперсии - это просто отношение каждого собственного значения к сумме. Не уверен, что вы ищете, если это не поможет. – Arun

ответ

3

Я не уверен, что это ваше замешательство.

pca$sdev^2 -> eigen values -> variance in each direction 
pca$sdev^2/sum(pca$sdev^2) = proportion of variance vector 

Таким образом, они связаны между собой.

Редактировать: Просто пример (чтобы проиллюстрировать это отношение), если это поможет.

set.seed(45) # for reproducibility 
# set a matrix with each column sampled from a normal distribution 
# with same mean but different variances 
m <- matrix(c(rnorm(200,2, 10), rnorm(200,2,10), 
       rnorm(200,2,10), rnorm(200,2,10)), ncol=4) 
pca <- prcomp(m) 

> summary(pca) # note that the variances here equal that of input 
# all columns are independent of each other, so each should explain 
# equal amount of variance (which is the case here). all are ~ 25% 
          PC1  PC2  PC3 PC4 
Standard deviation  10.9431 10.6003 10.1622 9.3200 
Proportion of Variance 0.2836 0.2661 0.2446 0.2057 
Cumulative Proportion 0.2836 0.5497 0.7943 1.0000 

> pca$sdev^2 
# [1] 119.75228 112.36574 103.27063 86.86322 

> pca$sdev^2/sum(pca$sdev^2) 
# [1] 0.2836039 0.2661107 0.2445712 0.2057142 
+0

Я вижу. Моя путаница в основном связана с тем, что я смотрю таблицу в публикации (http://dx.doi.org/10.1111/mec.12043, таблица 2). Вот первая строка: PC 1 Eig 24.27 PVE 51.00 – cryptic0

+0

Во-первых, ваш первый собственный вектор '54.33' ** NOT **' 5.433'. Во-вторых, так что, если его '24.27'' 51.00% '? 51% - '24.27/sum (...)'. Почему это вас беспокоит? – Arun

+0

Возможно, [этот пост] (https://stat.ethz.ch/pipermail/r-help/2005-August/076610.html) дополнительно помогает. Я не думаю, что о чем-то можно беспокоиться. – Arun