2015-07-13 4 views
-1

Я тестирую смешанную модель с 4 предикторами: 2 категориальных предиктора (соответственно 6 и 7 уровней) и 2 количественных предиктора.Условия смешанного взаимодействия в линейной модели

Я хотел бы знать, разрешено ли мне при тестировании моей модели создавать условия взаимодействия, в которых я смешиваю категориальные и количественные предсказатели.

Предположим, что Y = f(a, b) - это модель, которую я хочу проверить, a - это количественный предиктор, а b - категориальный предиктор.

Могу ли я искать (например, в R):

linfit <- lm(Y ~ a +b +a:b, data=mydata) 

Интерпретация результатов аналогична той, у меня есть при смешивании количественных предикторов?

+2

Это действительно проблема для Cross-Validated, поскольку она не имеет ничего общего с программированием _per se_. Короткий ответ: да, это вполне приемлемо. Интерпретация похожа на любой фиктивный непрерывный термин взаимодействия. – MichaelChirico

+0

Кроме того, в 'R' стенограмма' a * b' инкапсулирует 'a + b + a: b'. – MichaelChirico

+0

Спасибо. Я не знал о Cross Validated. С этого момента я задам свои статистические вопросы. Еще раз спасибо. – atalantafugiens

ответ

0

Во-первых, код, который вы написали, правильный, R даст вам результат. И если класс b уже настроен как фактор, R будет делать регрессию, считая b категориальным предиктором.

Во-вторых, я полагаю, вы спрашиваете о статистической интерпретации термина взаимодействия. Статистический смысл нижеприведенных трех ситуаций не одинаковый: (1) a и b являются количественными предикторами. В регрессионном результате из R будет четыре строки, a, b, a b, перехват. Процесс регрессии принимает b как другую количественную переменную и выполняет линейную регрессию.

y = β0 + β1⋅a + β2⋅b + β3⋅a*b

(2) а и Ь категориальные предикторы. Предположим, что a имеет 3 уровня и b имеет 2. Извлеките матрицу дизайна, которая состоит из 1 или 0;

y = β0 + β1⋅a2 + β2⋅a3 + β3⋅b2 + β4⋅a2*b2 + β5⋅a3*b2

(3) а является категоричным и б является количественным показателем. Предположим, что имеет 3 уровня.

y = β0 + β1⋅a2 + β2⋅a3 + β3⋅b + β4⋅a2*b + β5⋅a3*b

Для более подробной информации о плане взаимодействия и дизайна матрицы, обобщенная линейная модель будет более говорить об этом. Кроме того, это легко попробовать в R из результатов регрессии.

+0

В общем, неразумным советом предлагается отдельная интерпретация коэффициентов взаимодействия. Это также действительно вопрос вне темы, поэтому я присоединился к MichaelChirico в голосовании, чтобы его перенести. –