2015-02-03 7 views
1

Я работаю над опросом с общим наблюдением 288 (всего 108 полных ответов) и около 200 переменных. Я работаю над сокращением числа, использующего анализ основных компонентов, используя R.Удаление элемента PCA

Предположим, что 3 элемента (загружаемых в субдизат, называемый tmtformalizM) должны быть теоретически сокращены на один компонент (из обзора литературы) 7-балльная шкала Ликерта. Это извлечение PCA сделанного на матрице correllation, в сочетании с ортогональным вращением (варимакс):

Principal Components Analysis 
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax", 
scores = T) 
Standardized loadings (pattern matrix) based upon correlation matrix 
        RC1 RC2 h2 u2 
invapproccio  0.89 -0.11 0.81 0.19 
invformacomunic 0.60 0.53 0.64 0.36 
verbali   -0.07 0.91 0.84 0.16 

         RC1 RC2 
SS loadings   1.16 1.12 
Proportion Var  0.39 0.37 
Cumulative Var  0.39 0.76 
Proportion Explained 0.51 0.49 
Cumulative Proportion 0.51 1.00 

Test of the hypothesis that 2 components are sufficient. 

The degrees of freedom for the null model are 3 and the objective function  was 0.09 
The degrees of freedom for the model are -2 and the objective function was  0.74 
The total number of observations was 108 with MLE Chi Square = 77.17 with prob < NA 

Fit based upon off diagonal values = -0.86 

экстракция показывает 2 компонента (и ужасный припадок, как это возможно, что отрицательно?) , Альфа Кронбаха первого PCA, который имеет первые два предмета, очень низок (0,35).

Мой вопрос: в этом случае мне нужно отбросить первый компонент, идентифицированный анализом, но следует ли мне сохранить в качестве конечной переменной баллы пункта 3 (после PCA) или исходные значения опроса пункта 3?

Также рассмотрим случай PCA, в котором извлекаются 2 компонента (по 3 элемента каждый), а первый компонент имеет очень низкую надежность (второй компонент представляет собой Alpha> 0.8).

В этом случае мне нужно повторно выполнить PCA только на элементах, идентифицированных вторым компонентом, и взять эти оценки в качестве конечной переменной или просто сохранить оценки второго компонента, идентифицированного первым СПС?

Благодаря

+0

Это скорее статистическая проблема, чем проблема программирования, не так ли? –

+0

Да, вы правы, единственная проблема с программированием, которую я нашел, - это как фактически удалить компоненты с низкой степенью надежности ... но действительно вы правы, в основном теоретически – Niccolo

+0

Я согласен, что это непросто, поскольку вы используете R, но вопросы в основном статистические. –

ответ

0

Если вы думаете, что эти три вещи должны быть сформированы в один компонент, почему вы извлекая 2? Поймите проблему с подгонки, посмотрите на остатки решения. библиотека (псих) PC1 < - главный (tmtformalizM) кубовых остатков (PC1)

Я не понимаю, ваш второй вопрос.