В настоящее время я изучаю многочленную оценку логита, и я хочу использовать ее для оценки модели в R
с пакетом mlogit
. После детального изучения предмета было ясно, что важным шагом в этом процессе является изменение формы данных с использованием функции mlogit.data()
. Мой фрейм данных содержит следующую информацию:Изменение формы данных для мультиномиальной регрессии
satisfaction
:., Который является категориальным переменным от 1 (очень недовольны) до 5 (очень доволенeducation
: что число лет обучения индивидуальногоcountry
: которая является страной происхождения индивидуальногоaverage_income
: что является средним доходом в стране
Вот визуальный represention кадра данных:
> dat
country satisfaction education income
1 1 3 12 750
2 1 5 13 750
3 1 2 10 750
4 3 4 13 675
5 3 5 14 675
6 3 4 11 675
7 3 1 14 675
8 2 1 11 820
9 2 5 14 820
10 2 3 12 820
mlogit()
функция, кажется, не нравится в этой форме. Я пытаюсь оценить модель с satisfaction
в качестве зависимой переменной и education
в качестве независимой переменной.
Как я могу изменить его, чтобы он работал?
Пожалуйста, разместите свой код и появится сообщение с сообщением об ошибке. –
Мне непонятно, какова ваша переменная ответа. Это «удовлетворение»? Если это так, похоже, [* порядковая логистическая регрессия] (http://en.wikipedia.org/wiki/Ordered_logit) будет более уместным, чем многочлен. На веб-сайте статистики UCLA есть руководство по [порядковой логистической регрессии в R] (http://www.ats.ucla.edu/stat/r/dae/ologit.htm), которая может быть полезна и вам. – gung
Используйте вместо этого функцию 'multinom' в пакете' nnet'. 'multinom (satisf ~ ..., data = dat)' автоматически преобразует 'удовлетворение' в многомерный массив с * минимальным *, обрабатываемым как уровень референта (в отличие от SAS, использующего первое значение в данных). – AdamO