У меня есть два набора данных:SAS: Учеб рода nodupkeys ошибка
- "матерей" - 5,512 наблюдения, где переменная "МАМА" = 1
- "all_women" - 2,336,750 наблюдения, где переменная "МАМА" = 0
Я объединить два следующим образом:
data combined;
set mothers all_women;
Теперь, когда матери уже я n datset all_women, я хочу удалить повторяющиеся записи - при условии, что я сохраню наблюдения, где «MOTHER» = 1.
Я попытался следующие:
proc sort data=combined; by ID DESCENDING MOTHER; run;
proc sort data=combined nodupkeys; by ID; run;
пока я теряю некоторые из матерей, потому что я остался только с 5458 наблюдений, где «МАМА» = 1. Что я сделал, чтобы ввести эту ошибку?
Вы подтвердили, что у «матерей» есть 5 512 уникальных идентификаторов? – Jeff
Кажется странным УСТАНОВИТЬ два набора данных вместе и ожидать того же количества записей, что и первый набор данных, я бы ожидал слияния вместо SET в вашем объединенном наборе данных. – Reeza