Я пытаюсь моделировать срок службы клиентов при подписке. Поскольку данные подвергаются цензуре, я буду использовать пакет выживаемости R для создания кривой выживания.Как ввести цензурные данные в модель выживания R?
оригинальный подписок набор данных выглядит следующим образом ..
id start_date end_date
1 2013-06-01 2013-08-25
2 2013-06-01 NA
3 2013-08-01 2013-09-12
Что я манипулировать, чтобы выглядеть следующим образом ..
id tenure_in_months status(1=cancelled, 0=active)
1 2 1
2 ? 0
3 1 1
..в для того, чтобы кормить модель выживания:
obj <- with(subscriptions, Surv(time=tenure_in_months, event=status, type="right"))
fit <- survfit(obj~1, data=subscriptions)
plot(fit)
Что я должен внести в переменную tenure_in_months для сохраненных случаев, то есть случаев, когда подписка по-прежнему активна сегодня - должна ли она существовать до сегодняшнего дня или должна быть НС?
он должен быть до того дня, когда вы собрали свои данные, я думаю, что это «сегодня». – drevicko