В настоящее время я столкнулся с проблемой в SAS. Я пишу магистерскую диссертацию о профессиональных травмах и о потере заработной платы, причиненной таким несчастным случаем. У меня есть набор данных с ежемесячной информацией о заработной плате для данного населения. Набор данных содержит конкретный идентификатор для каждого человека, а также ряд справочной информации, такой как образование, пол и т. Д. Если человек получил платеж по заработной плате за определенный месяц, он или она находится в моем наборе данных за этот конкретный месяц с вышеуказанным месяцем, упомянутой информации. Если человек не получил оплату заработной платы в течение определенного месяца (например, из-за безработицы, отпуска, болезни и т. Д.), Это лицо не найдено в моем наборе данных за этот конкретный месяц - даже если это лицо могло получить выплату заработной платы как в предыдущем месяце, так и в более позднем месяце. Так, например, человек, который работал целый год, имеет 12 наблюдений в наборе данных. Если кто-то по какой-то причине не работал в течение 2 месяцев, у этого человека есть только 10 наблюдений.Генерация наблюдений за несуществующими наблюдениями
Я, скорее всего, получу положительное уклонение в своих оценках, если я не позабочусь об этой проблеме. Человек может страдать от производственного травматизма в течение определенного месяца, а затем возвращаться через месяц после этого, месяц, когда данное лицо отсутствует в связи с болезнью, должно составлять оплату заработной платы, но все равно содержать «справочную» информацию.
Я загрузил пример набора данных, который можно найти здесь:
https://www.dropbox.com/s/0zkr0430menotdf/Data.xlsx?dl=0
Данные содержат три человека (1,2,3) с информацией заработной платы, группы образования, пола. Лицо с идентификатором 2 не получило платеж за 8-й месяц и, следовательно, не наблюдает за этим месяцем.
Я не знаю, как сделать программу SAS, которая заполнила бы информацию для этого человека. Я хотел бы сделать новое наблюдение за 8-м месяцем для человека 2 с выплатой заработной платы в ноль, но с запаздывающей информацией о других переменных за предыдущий месяц. В моем исходном наборе данных у меня много тысяч человек, где некоторый потенциал может иметь несколько несуществующих данных о заработной плате.
просто добавил дополнительный бит для вменения отсутствующих значений – Altons
добавить пол в таблице пользователей – Altons
Спасибо большое, Alton! Я попробую! Я не думал об этом. –