2013-06-23 6 views
1

Я хочу, чтобы определить предельные эффекты каждой зависимой переменной в регрессии пробит следующим образом:предсказать и мультипликативные переменные/условия взаимодействия в пробит регрессий

  • предсказать (базовый) вероятность со средним значением каждой переменной
  • для каждого переменного, предсказать изменение вероятности по сравнению с базовой вероятностью, если переменные принимает значение среднего + 1x стандартного отклонения переменного

в одном из моих регрессий, у меня есть мультипликативный переменный, следующим образом:

my_probit <- glm(a ~ b + c + I(b*c), family = binomial(link = "probit"), data=data) 

два вопроса:

  1. Когда я определить предельные эффекты, используя подход выше, будет значение мультипликативного термина отражает значение б или принимать значения означают + 1x стандартное отклонение переменной?
  2. Тот же вопрос, но с термином взаимодействия (* и no I()) вместо мультипликативного термина.

Большое спасибо

+0

Можете ли вы пояснить, как вы используете термин «маргинальный» здесь? Я бы подумал о маргинальном соотношении b/t a & b как о выходе из 'a ~ b' (т. Е. О' + c + I (b * c) '). Кроме того, я смущен о вашем различии b/t «термин взаимодействия» и «мультипликативный термин». Они кажутся мне синонимом. Например, 'a + b + I (a * b)' == 'a * b'. – gung

+0

Я понимаю, что функция I() и функции взаимодействия (*,: или /) не совсем одинаковы, см. [Link] (http://cran.r-project.org/doc/manuals/R- intro.html # Формула-для-статистического-моделей).По маргинальному эффекту я имею в виду тот эффект, что предельное изменение (на одно стандартное отклонение в моем случае) зависимой переменной будет иметь на прогнозируемую вероятность, чтобы оценить ее экономическое значение. – bdu

+1

Рассматривая эту ссылку, кажется, что дело о числовых взаимодействиях фактически не рассматривается. И получается, что тестирование @gung правильное в том, что результаты для 'a + b + I (a * b)' и 'a * b' эквивалентны. Очевидно, что они не будут эквивалентны для 'a * a' (что то же самое, что' a') и 'I (a * a)', которое является 'I (a^2)'. –

ответ

4

При интерпретации результатов моделей с условия взаимодействия, общее правило НЕ интерпретировать коэффициенты. Само наличие взаимодействий означает, что значение коэффициентов для термов будет варьироваться в зависимости от других значений вариации, используемых для прогнозирования. Правильный способ взглянуть на результаты - это построить «сетку прогноза», то есть набор значений, расположенных на расстоянии диапазона интересов (надеюсь, в области поддержки данных). Две основные функции для этого процесса: expand.grid и predict.

dgrid <- expand.grid(b=fivenum(data$b)[2:4], c=fivenum(data$c)[2:4] 
# A grid with the upper and lower hinges and the medians for `a` and `b`. 

predict(my_probit, newdata=dgrid) 

Вы можете иметь прогнозы по шкале, кроме значения по умолчанию (который должен возвращать линейный предсказатель), так что, возможно, это было бы легче интерпретировать, если бы это было:

predict(my_probit, newdata=dgrid, type ="response") 

Обязательно прочтите ?predict и ?predict.glm и проведите несколько простых примеров, чтобы убедиться, что вы получаете то, что вы намеревались.

Предсказания моделей, содержащих взаимодействия (по крайней мере, с участием 2 ковариатов), следует рассматривать как поверхности или двухмерные многообразия в трех измерениях. (И для 3-ковариационных взаимодействий как изо-значных огибающих.) Причина, по которой модели взаимодействия не могут быть разложены на отдельные термины «эффекты», состоит в том, что наклоны поверхностей планарного предсказания остаются постоянными на всех уровнях ввода. Такого не происходит при взаимодействиях, особенно с мультипликативными и нелинейными модельными структурами. Графические инструменты и идеи, которые можно получить в курсе дифференциальных уравнений, могут быть продуктивно применены здесь.

+0

+1, это правильный совет. Аналогичный подход заключается в построении отношения b/t 'a' &' b' при нескольких разных значениях 'c' (например, среднее значение' c' & +/- 'SD). Я проиллюстрировал случай построения нескольких различных строк (хотя и без взаимодействия) в ответе на CV здесь: [Графическая кривая вероятности для логитной модели с несколькими предикторами] (http://stats.stackexchange.com/questions/ 31597 // 31600 # 31600). – gung

+0

Спасибо. Это действительно очень полезно. Во избежание сомнений я бы подумал, что можно оценить два предельных эффекта для термина взаимодействия: один для среднего (a) + SD (a) и средний (b), а другой для средних (a) и (b) + SD (b). Должен ли я полностью исключить этот подход? Если нет, как мне это сделать? – bdu

+0

Думаю, вам следует отказаться от понятия, что есть «термин взаимодействия» и «предельные термины». Вы должны думать о линейных и взаимодействующих вкладах в один шаблон взаимодействия. Вы должны использовать как минимум среднее значение и +/- SD для обоих вариантов. Это было бы чуть более сложным, чем медианный медианный +/- шарнирный подход, который я предлагал. –