То, что я пытаюсь сделать, - это подогнать 5 кривых Каплана Мейера на 5 вмененных наборов данных от MICE. То, что я намереваюсь сделать, это в каждый момент времени, взять среднее из 5 вероятностей выживания. Я думаю, что это было бы легко, если бы у меня была точная форма функции шага, которая составляет каждую из кривых KM, но я не знаю, как ее извлечь.Извлечение функции шага Kaplan-Meier
Вот пример кода, который я хотел бы запустить
#make up data
survival_time=rexp(10,3)
dead=sample(c(0,1),10,replace=TRUE)
gender=sample(c(0,1),10,replace=TRUE)
#induce missingness in gender
gender[3:5]=NA
data=cbind(survival_time,dead,gender)
#do imputation
imp=mice(data)
#fit KM curves on each of the imputed datasets
km_fit=with(imp,survfit(Surv(survival_time,dead)~gender))
#now break down each km curve into male and female
#and average the surv prob at each time
#but how?
Задача состоит в том, что продолжительность жизни и показатель смертности всегда фиксирована, но сумма в каждом гендерных изменений между вменения. Из-за этого число в каждой группе и, следовательно, количество и время событий изменяются между вменением.
Каким бы ни был мой план, если бы я мог получить функции шага, было бы использовать применение предсказывать функции шага, чтобы получить средства. Это лучшее решение, или вы думаете, что будет лучше?
Помогает ли 'summary (km_fit)' help? – Benjamin
Я полагаю, что я мог бы вручную составить оценку Kaplan Meier, но я бы предпочел использовать встроенную функцию R, если она существует. – RayVelcoro
На самом деле может быть проще использовать пакет метлы. 'library (метла)', а затем 'tidy (km_fit)'. – Benjamin