Я работаю над опросом с общим наблюдением 288 (всего 108 полных ответов) и около 200 переменных. Я работаю над сокращением числа, использующего анализ основных компонентов, используя R.Удаление элемента PCA
Предположим, что 3 элемента (загружаемых в субдизат, называемый tmtformalizM) должны быть теоретически сокращены на один компонент (из обзора литературы) 7-балльная шкала Ликерта. Это извлечение PCA сделанного на матрице correllation, в сочетании с ортогональным вращением (варимакс):
Principal Components Analysis
Call: principal(r = tmtformalizM, nfactors = 2, rotate = "varimax",
scores = T)
Standardized loadings (pattern matrix) based upon correlation matrix
RC1 RC2 h2 u2
invapproccio 0.89 -0.11 0.81 0.19
invformacomunic 0.60 0.53 0.64 0.36
verbali -0.07 0.91 0.84 0.16
RC1 RC2
SS loadings 1.16 1.12
Proportion Var 0.39 0.37
Cumulative Var 0.39 0.76
Proportion Explained 0.51 0.49
Cumulative Proportion 0.51 1.00
Test of the hypothesis that 2 components are sufficient.
The degrees of freedom for the null model are 3 and the objective function was 0.09
The degrees of freedom for the model are -2 and the objective function was 0.74
The total number of observations was 108 with MLE Chi Square = 77.17 with prob < NA
Fit based upon off diagonal values = -0.86
экстракция показывает 2 компонента (и ужасный припадок, как это возможно, что отрицательно?) , Альфа Кронбаха первого PCA, который имеет первые два предмета, очень низок (0,35).
Мой вопрос: в этом случае мне нужно отбросить первый компонент, идентифицированный анализом, но следует ли мне сохранить в качестве конечной переменной баллы пункта 3 (после PCA) или исходные значения опроса пункта 3?
Также рассмотрим случай PCA, в котором извлекаются 2 компонента (по 3 элемента каждый), а первый компонент имеет очень низкую надежность (второй компонент представляет собой Alpha> 0.8).
В этом случае мне нужно повторно выполнить PCA только на элементах, идентифицированных вторым компонентом, и взять эти оценки в качестве конечной переменной или просто сохранить оценки второго компонента, идентифицированного первым СПС?
Благодаря
Это скорее статистическая проблема, чем проблема программирования, не так ли? –
Да, вы правы, единственная проблема с программированием, которую я нашел, - это как фактически удалить компоненты с низкой степенью надежности ... но действительно вы правы, в основном теоретически – Niccolo
Я согласен, что это непросто, поскольку вы используете R, но вопросы в основном статистические. –