Если вы посмотрите на bazehaz.gbm, вы увидите, что gbm.predict дает lambda_0 (t).
The proportional hazard model assumes h(t|x)=lambda(t)*exp(f(x)).
gbm can estimate the f(x) component via partial likelihood.
After estimating f(x), basehaz.gbm can compute the a nonparametric estimate of lambda(t).
Таким образом, вы можете пойти, как это (я надеюсь):
model = gbm(Surv(durata, status2015) ~ .-fold, data= ...)
XB =predict.gbm(model, n.trees = ..., type = "response")
lambda0 = basehaz.gbm(t = data$time, delta = data$censoring, t.eval = sort(unique(data$time)), cumulative = FALSE, f.x = XB , smooth=T)
XBnew =predict.gbm(model, n.trees = ..., data=newData, type = "response")
hazard = h(t|x)= lambda0*exp(XBnew).
Если вы ищете функции выживания .. Я работаю над этим. :)
P.S .: В оценке мысли XB существует странное поведение, поскольку оно значительно меняется с количеством деревьев. :(
Я пробовал ваш подход, почему XB и XBnew такие же, даже если я использую данные по-разному – BigDataScientist