В настоящее время ведутся исследования о вероятности выхода из компании CEO (двоичная переменная = «1», если она оставлена). Мои данные - данные несбалансированной панели для 50 компаний с 51 физическим лицом в ней на период 2013-2015 годов.Как анализировать данные панели в R с использованием логистической регрессии (glmmML)?
Я пытался запустить две модели регрессии (фиксированные и случайные эффекты) с использованием пакета glmmML
. Однако я получаю следующее предупреждение:
pdata <- plm.data(ceodata, index=c("id","year"))
fixed <- glmmboot(left ~ age+tenure+boardappr+ROE,
family=binomial(link="logit"), data=pdata, cluster=id)
Warning messages:
1: In model.response(mf, "numeric") : using type = "numeric" with a factor response will be ignored
2: In glmmbootFit(X, Y, weights, start.coef, cluster, offset, family, :[glmmboot:] Information non-positive definite. No variance!
3: In Ops.factor(Y, res$fitted) : ‘/’ not meaningful for factors
4: In Ops.factor(Y, log(ifelse(Y == 0, 1, Y/res$fitted))) ‘*’ not meaningful for factors
5: In Ops.factor(1, Y) : ‘-’ not meaningful for factors
6: In Ops.factor(1, Y) : ‘-’ not meaningful for factors
Когда я меняю набор переменных, я получаю одинаковые предупреждения и бессмысленные результаты регрессии. Мне было интересно, что я делаю что-то неправильно или есть проблема с данными, которые я использую? Возможно, кто-то может поделиться кодом для запуска моделей с фиксированным и случайным эффектом, а также для теста Hausman для логистической регрессии?
P.S. Данные, которые я использовать выглядеть следующим образом: