2013-04-07 5 views
1

Поэтому я использую survreg, и я ожидаю, что мои предсказанные результаты подчиняются нижней границе 0, но они часто указывают на отрицательные результаты. Я думаю, что это как-то оценка линейного результата вместо модели выживаемости, которую я пытаюсь создать. Вот что я сделал:Прогнозирование с survreg/tobit проходит мимо связанных

linear.first.stage<-lm(y ~ x, data=clip) 

Сначала я оценил некоторые моменты, чтобы ускорить процесс оценки. Он не сходится без этой первой стадии. Я создаю объект для выживания, следуя коду из «survreg», который дает явный пример регрессии с чередованием. Я дублировал это ниже для x и y. В моем наборе данных y можно наблюдать только при неотрицательном значении, но если оно положительно, оно обычно распределяется обычно около 200 или около того с sd около 20. X может принимать любое значение и не теоретически связан любым конкретным числом, которое сразу приходит в голову.

surv_y<-Surv(clip$y, clip$y>0,type="left") 
first.stage<-survreg(surv_y ~ x,init=(linear.first.stage), dist="gaussian", data=clip) 

Я управляю регрессией выживания, которая должна быть эквивалентна Тобиту. Для того, чтобы подтвердить, что моя интерпретация событий были такими же, я побежал следующее:

test<-tobit(y~x, left=0, right=Inf, dist="gaussian", data=clip) 
p_test<-predict(test) 
p<-predict(first.stage) 
plot(p_test-p) 

График показывает плоскую линию в нуле, поэтому при визуальном осмотре эти команды идентичны, так как они должны быть. Однако в обоих случаях прогнозируются результаты в пределах 0. Это проблематично, потому что я заявил, что левая граница наблюдаемой информации равна 0. Мои ожидания заключаются в том, что все предсказанные значения должны быть> 0.

Я пробовал предсказать использование типов «link», «response», «linear», но безрезультатно. Я предполагаю, что команда прогнозирования дает результаты , как если бы цензура не происходила. Как создать предсказание, которое подчиняется нижней границе 0?

Ссылки:

  1. Running predict() after tobit() in package AER
  2. https://stats.stackexchange.com/questions/11440/standardized-residuals-of-a-tobit-model-in-r
+0

Можете ли вы объяснить конструкцию объекта 'Surv'? 'Event' определяется' clip $ y> 0'. Итак, почему бы не заставить некоторые из прогнозов быть отрицательными? (Я действительно не понимаю, как эта конструкция имеет смысл.) Определение события на основе времени наблюдения просто кажется неправильным. Обычно нужно, чтобы процесс выживания и цензуры был более независимым, чем этот.) –

+0

I Я не уверен, что понимаю ваш комментарий о времени наблюдения - я только знаком с использованием Тобита этой регрессии. Возможно, я неправильно понимаю применение суррога? Я попытался разъяснить выше. – RegressForward

+0

Я использовал то же самое, используя консервированную команду Tobit, поэтому, как минимум, я не смущен тем, как здесь работает синтаксис команды. В этом случае Y не является продолжительностью. Вместо этого y - это что-то вроде заработной платы (которая не может опускаться ниже 0), а x - это что-то вроде уровней образования, что является фактором занятости/заработной платы. – RegressForward

ответ

0

Ответ: Товит не правильный тип регрессии. Товит предсказывает, какой результат должен быть в отсутствии усечения.

+0

Не могли бы вы рассказать о своем ответе? Если Товит предсказывает, что должно быть в отсутствии усечения (не знаю, что ...), что следует использовать для предсказания с усечением? Благодаря! – Matifou

+0

Я реструктурировал свой процесс оценки, чтобы отразить модель с нулевым раздувом или препятствием. Tobit предназначен для цензурированных данных, он говорит, что существует ненулевой результат, но мы наблюдаем только 0, потому что информация как-то скрыта. Например, заработная плата женщин должна соответствовать Тобиту, потому что замужние женщины, которые предпочитают не работать, по-прежнему имеют оговорку о заработной плате и все еще имеют некоторое (невидимое) возвращение к усилиям, выполняющим неоплачиваемый труд любого типа. Модели с нулевым раздувом или с препятствиями показывают, что результат действительно равен нулю. Как и в случае, никаких преступлений не было. Или нет созданных виджетов. Они более точно отражают мою модель. – RegressForward

0

Возможно, вам необходимо масштабировать прогноз в том смысле, который описан here одним из авторов пакета.