Поэтому я использую survreg, и я ожидаю, что мои предсказанные результаты подчиняются нижней границе 0, но они часто указывают на отрицательные результаты. Я думаю, что это как-то оценка линейного результата вместо модели выживаемости, которую я пытаюсь создать. Вот что я сделал:Прогнозирование с survreg/tobit проходит мимо связанных
linear.first.stage<-lm(y ~ x, data=clip)
Сначала я оценил некоторые моменты, чтобы ускорить процесс оценки. Он не сходится без этой первой стадии. Я создаю объект для выживания, следуя коду из «survreg», который дает явный пример регрессии с чередованием. Я дублировал это ниже для x и y. В моем наборе данных y можно наблюдать только при неотрицательном значении, но если оно положительно, оно обычно распределяется обычно около 200 или около того с sd около 20. X может принимать любое значение и не теоретически связан любым конкретным числом, которое сразу приходит в голову.
surv_y<-Surv(clip$y, clip$y>0,type="left")
first.stage<-survreg(surv_y ~ x,init=(linear.first.stage), dist="gaussian", data=clip)
Я управляю регрессией выживания, которая должна быть эквивалентна Тобиту. Для того, чтобы подтвердить, что моя интерпретация событий были такими же, я побежал следующее:
test<-tobit(y~x, left=0, right=Inf, dist="gaussian", data=clip)
p_test<-predict(test)
p<-predict(first.stage)
plot(p_test-p)
График показывает плоскую линию в нуле, поэтому при визуальном осмотре эти команды идентичны, так как они должны быть. Однако в обоих случаях прогнозируются результаты в пределах 0. Это проблематично, потому что я заявил, что левая граница наблюдаемой информации равна 0. Мои ожидания заключаются в том, что все предсказанные значения должны быть> 0.
Я пробовал предсказать использование типов «link», «response», «linear», но безрезультатно. Я предполагаю, что команда прогнозирования дает результаты , как если бы цензура не происходила. Как создать предсказание, которое подчиняется нижней границе 0?
Ссылки:
- Running predict() after tobit() in package AER
- https://stats.stackexchange.com/questions/11440/standardized-residuals-of-a-tobit-model-in-r
Можете ли вы объяснить конструкцию объекта 'Surv'? 'Event' определяется' clip $ y> 0'. Итак, почему бы не заставить некоторые из прогнозов быть отрицательными? (Я действительно не понимаю, как эта конструкция имеет смысл.) Определение события на основе времени наблюдения просто кажется неправильным. Обычно нужно, чтобы процесс выживания и цензуры был более независимым, чем этот.) –
I Я не уверен, что понимаю ваш комментарий о времени наблюдения - я только знаком с использованием Тобита этой регрессии. Возможно, я неправильно понимаю применение суррога? Я попытался разъяснить выше. – RegressForward
Я использовал то же самое, используя консервированную команду Tobit, поэтому, как минимум, я не смущен тем, как здесь работает синтаксис команды. В этом случае Y не является продолжительностью. Вместо этого y - это что-то вроде заработной платы (которая не может опускаться ниже 0), а x - это что-то вроде уровней образования, что является фактором занятости/заработной платы. – RegressForward