2016-11-04 10 views
1

Я использую gbm в r для прогнозирования выживания (распределение = «coxph»).GBM in r для функции потери coxph

Прогнозируемые значения, когда gbm.predict (...., type = "response") находятся в диапазоне от [-0.001 до 0.5] приблизительно.

Как я могу интерпретировать риск нового образца без риска в диапазоне от 0 до 1 ([0,1]).

ответ

0

Если вы посмотрите на bazehaz.gbm, вы увидите, что gbm.predict дает lambda_0 (t).

The proportional hazard model assumes h(t|x)=lambda(t)*exp(f(x)). 
gbm can estimate the f(x) component via partial likelihood. 
After estimating f(x), basehaz.gbm can compute the a nonparametric estimate of lambda(t). 

Таким образом, вы можете пойти, как это (я надеюсь):

model = gbm(Surv(durata, status2015) ~ .-fold, data= ...) 
XB =predict.gbm(model, n.trees = ..., type = "response") 

lambda0 = basehaz.gbm(t = data$time, delta = data$censoring, t.eval = sort(unique(data$time)), cumulative = FALSE, f.x = XB , smooth=T) 
XBnew =predict.gbm(model, n.trees = ..., data=newData, type = "response") 

hazard = h(t|x)= lambda0*exp(XBnew). 

Если вы ищете функции выживания .. Я работаю над этим. :)

P.S .: В оценке мысли XB существует странное поведение, поскольку оно значительно меняется с количеством деревьев. :(

+0

Я пробовал ваш подход, почему XB и XBnew такие же, даже если я использую данные по-разному – BigDataScientist

 Смежные вопросы

  • Нет связанных вопросов^_^