Скажем, у меня есть данные для 300 фирм (уровень 1) в 10 странах (уровень 2). Переменные уровня 1 - это PQ и размер. Переменная уровня 2 - это ВВП на душу населения.Правильный способ масштабирования для многоуровневой регрессии с использованием lmer [R]
library(lme4)
set.seed(1)
PQ <- runif(300,7,21)
id <- (1:300)
country <- sample(1:10,300,replace=T)
size <- sample(1:25000,300,replace=T)
GDP <- sample(800:40000,10,replace=T)
Country1 <- 1:10
L1data <- as.data.frame(cbind(id,country,PQ,size))
L2data <- as.data.frame(cbind(Country1,GDP))
MLdata <- merge(L1data,L2data, by.x = "country", by.y = "Country1")
dummymodel <- lmer(PQ ~ size + GDP + (size|country), data = MLdata, REML = F)
Когда я запускаю это я получаю Предупреждающие сообщения
Предупреждение сообщений: 1: Некоторые переменные предсказателя находятся на очень разных масштабах: рассмотреть масштабировании 2: В checkConv (ATTR (OPT "derivs"), opt $ par, ctrl = control $ checkConv,: Model не сходится с max | grad | = 1.77081 (tol = 0.002, компонент 1) 3: В checkConv (attr (opt, «производные»), opt $ par, ctrl = control $ checkConv,:
Модель почти не идентифицируется: очень большое собственное значение - Перемасштабировать переменные ?; Модель почти не идентифицируется: большое отношение собственных значений - переменные масштабирования?
В самом деле, когда я запустить модель с исходными данными я получаю дополнительное предупреждение:
Модель не сходится: вырожденный Гессе с 1 отрицательных собственных
Я предполагаю, что я необходимо масштабировать независимые переменные для решения этой проблемы. Каков правильный способ масштабирования в многоуровневой регрессии? Вопрос важен, поскольку результаты многоуровневых моделей зависят от масштабирования. Или есть какая-то другая проблема, которую я не могу найти?
После масштабирования всех переменных 'as.data.frame (scale (MLdata))', модель правильно установлена. –
Спасибо. Действительно ли это теоретически справедливо для масштабирования данных, подобных этому в многоуровневых? Результаты и дисперсия, объясняемые каждым уровнем, имеют значительные изменения из-за масштабирования. –