2016-02-06 9 views
2

Моя структура данных:Как включить State N в качестве весовой переменной в SPSS?

State   N   Var1   Var2 
Alabama   23   54    42 
Alaska   4   53    53 
Arizona   53   75    65 

Var1 и Переменная2 являются агрегированные процентные значения на государственном уровне. N - количество участников в каждом штате. Я хотел бы запустить линейную регрессию между Var1 и Var2 с учетом N как веса, что лучший способ сделать это в SPSS?

ответ

2

Вы можете использовать WEIGHT BY или использовать подкоманду на REGRESSION - примеры ниже.

DATA LIST FREE/State (A15) N Var1 Var2 (3F2.0). 
BEGIN DATA 
Alabama   23   54    42 
Alaska   4   53    53 
Arizona   53   75    65 
END DATA. 

WEIGHT BY N. 
REGRESSION 
    /MISSING LISTWISE 
    /STATISTICS COEFF OUTS R ANOVA 
    /CRITERIA=PIN(.05) POUT(.10) 
    /NOORIGIN 
    /DEPENDENT Var1 
    /METHOD=ENTER Var2. 

*Or using subcommand. 
WEIGHT OFF.  
REGRESSION 
    /MISSING LISTWISE 
    /REGWGT=N 
    /STATISTICS COEFF OUTS R ANOVA 
    /CRITERIA=PIN(.05) POUT(.10) 
    /NOORIGIN 
    /DEPENDENT Var1 
    /METHOD=ENTER Var2. 

Вы сами видите, что эти две процедуры дают одинаковые оценки. И если вы запустите регрессию без взвешивания или с помощью подкоманды REGWGT, это приведет к разным оценкам для этого примера.

+0

Спасибо, но когда я добавил вес в анализ, большинство стали статистически значимыми (p <0,05), но отношение было в противоположном (чем ожидалось) направлении. Является ли взвешенный всегда более предпочтительным, чем невзвешенный в экологическом исследовании (например, тот, который я изучаю)? – KubiK888

+0

Я предположил, что ваши весы обозначают повторяющиеся измерения - частотные веса. Чтобы понять, почему изменились отношения, вы можете сделать диаграмму рассеяния, где размер точки зависит от веса. –

0

В чем причина использования N в качестве веса? Если вы хотите это сделать, поскольку регрессия считает вес весом репликации, вам нужно быть осторожным в своих степенях свободы.

+0

N представляет количество твитов, поступающих из этого состояния, оно может или не может реплицировать пользователей, и оно может иметь или не иметь репликации твитов, но я подумал, что это хорошая идея рассматривать состояния по-разному, чтобы их вес основывался на сумме информации для агрегированных мер. Вы рекомендуете не использовать вес в этом свете, если бы вы могли сообщить мне почему? – KubiK888

+0

Вместо использования его в качестве весовой переменной укажите его как вес в самой процедуре регрессии. – JKP

+0

Это будет ответ Энди, правильно? – KubiK888

 Смежные вопросы

  • Нет связанных вопросов^_^