Я пытаюсь использовать модели регрессионной модели смешанных эффектов, но я обеспокоен размерами переменных выборок в каждом кластере/группе, а также очень низким числом «успехов», в некоторых моделях.Переменный размер выборки для каждого кластера/группы в смешанных эффектах Логистическая регрессия
У меня есть ~ 700 деревьев, распределенных по 163 полям (т. Е. Группа/группа), ежегодно посещаемых с 2004 по 11. Я устанавливаю отдельные модели логистической регрессии смешанных эффектов (далее GLMM) для каждого года исследования, чтобы сравнить этот результат с выводом из общей модели уязвимости (т. Е. Анализ выживаемости со случайным эффектом).
Количество деревьев на участок варьируется от 1-22. Кроме того, в течение нескольких лет очень мало «успехов» (т. Е. Больных деревьев). Например, в 2011 году было всего 4 успеха из 694 «неудач» (т. Е. Здоровых деревьев).
Мои вопросы: (1) существует общее правило для идеального числа образцов | группа, когда фокус вывода - только для оценки фиксированных эффектов в GLMM, и (2) являются стабильными GLMM, когда существует такое крайняя разница в соотношении успехов: неудачи.
Благодарим за любые советы или предложения источников.
Сара
Потому что это (хорошо) вопрос так очень мало содержания программ, было бы лучше спросил более на HTTP://stats.stackexchange.com/. Просто не забудьте удалить его здесь, прежде чем переместить его, чтобы он не попал в перекрестные сообщения. –
Сердечно согласен с Джошем. Я думаю, что предлагаю некоторый предварительный R-код, когда вы повторно разместите, все равно сделайте это более «конкретным». (4/694) не является особенно низкой частотой событий для модели Пуассона. –