2013-06-24 3 views
2

Я использую функцию multinom из пакета nnet для запуска многокомпонентной логистической регрессии.Установленные значения для мультинома в R: Коэффициенты для справочной категории?

В полиномиальной логистической регрессии, как я понимаю, коэффициенты изменения в журнале соотношения вероятности ответа по вероятности эталонного ответа (то есть, Ln (P (я)/P (r)) = B + B * X ... где i - одна категория отклика, r - ссылочная категория, а X - некоторый предиктор).

Тем не менее, установленный (multinom (...)) производит оценки для каждой категории, даже ссылочной категории r.

РЕДАКТИРОВАТЬ Пример:

set.seed(1) 
library(nnet) 
DF <- data.frame(X = as.numeric(rnorm(30)), 
       Y = factor(sample(letters[1:5],30, replace=TRUE))) 
DF$Y<-relevel(DF$Y, ref="a") #ensure a is the reference category 
model <- multinom(Y ~ X, data = DF) 
coef(model) 
# (Intercept)   X 
#b 0.1756835 0.55915795 
#c -0.2513414 -0.31274745 
#d 0.1389806 -0.12257963 
#e -0.4034968 0.06814379 

head(fitted(model)) 
#   a   b   c   d   e 
#1 0.2125982 0.2110692 0.18316042 0.2542913 0.1388810 
#2 0.2101165 0.1041655 0.26694618 0.2926508 0.1261210 
#3 0.2129182 0.2066711 0.18576567 0.2559369 0.1387081 
#4 0.1733332 0.4431170 0.08798363 0.1685015 0.1270647 
#5 0.2126573 0.2102819 0.18362323 0.2545859 0.1388516 
#6 0.1935449 0.3475526 0.11970164 0.2032974 0.1359035 

head(DF) 
#   X Y 
#1 -0.3271010 a 

Для вычисления прогнозируемого коэффициента вероятности между ответом б и ответ для строки 1, вычислим exp(0.1756835+0.55915795*(-0.3271010)) = 0,9928084. И я вижу, что это соответствует установленному P (b)/P (a) для строки 1 (0.2110692/0.2125982 = 0.9928084).

Является ли установленная вероятность для ссылочной категории рассчитанной алгебраически (например, 0.2110692/exp(0.1756835+0.55915795*(-0.3271010)))?

Есть ли способ получить уравнение для прогнозируемой вероятности ссылочной категории?

+1

Я добавить некоторые данные на ваш вопрос. Вы можете уточнить свой вопрос, используя этот пример? ожидаемый результат? – agstudy

+0

Помимо отсутствия примера данных или спецификации пакета, из которого может быть извлечено финансирование «multinom», я верю, что вы неправильно указали, как представлять коэффициенты шансов. Коэффициенты «P (i)/P (! I)», поэтому коэффициенты коэффициентов имеют 4 выражения вероятности в форме отношения. –

+0

DWin, вы правы в отношении биномиальной логистической регрессии. Однако я считаю, что в многолинейной логистической регрессии прогнозируемое отношение шансов на самом деле является отношением вероятности некоторого ответа на вероятность ссылочного ответа - см. Соответствующую [страницу Википедии] (http://en.wikipedia.org/wiki/Multinomial_logistic_regression). – jflournoy

ответ

5

У меня был такой же вопрос, и, оглядевсь, я думаю, что решение: задано 3 класса: a, b, c и установленные (модельные) вероятности pa, pb, pc, выводимые по алгоритму, вы можете восстановить эти вероятности из этих 3-х уравнений:

log(pb/pa) = beta1*X 

log(pc/pa) = beta2*X 

pa+pb+pc=1 

Где бета1, бета2 являются строки вывода коэф (модели), а X ваши входные данные.

Играя с этими уравнениями вы получите в:

pb = exp(beta1*X)/(1+exp(beta1*X)+exp(beta2*X)) 

pc = exp(beta2*X)/(1+exp(beta1*X)+exp(beta2*X)) 

pa = 1 - pb - pc