В кадре данных у меня есть две категориальные переменные, скажем qs
и vr
данных кадра df
. Этот блок данных довольно большой, но предположим, что это 100 различных уровней в qs
, не обязательно следуя шаблону. Вектор столбца vr
, который, как сказано, также является категориальной переменной, имеет некоторые отсутствующие значения.Замена недостающих значений вектора столбца
Что я хочу сделать, это обозначить недостающие значения, которые существуют в vr
, в соответствии с соответствующей категорией или значением в qs
.
Я знаю априори, что 9 различных категорий в qs
, для которых vr
имеет отсутствующие значения. Скажем, что ярлык для одной категории в qs
равен 102
, и для этой категории в qs
в vr
отсутствуют.
Итак, что я хочу, чтобы потом сделать
- если категория/метка/значение в достаточном количестве == 102 == множества вр
Greece
- если категория/метка/значение в QS == 250 set vr ==
Italy
конец и дальше.
К сожалению, мой dataframe очень сложный и я не знаю, как я могу воспроизвести простую фреймворку данных.
«Vr» все NA для «QS» 3. Я думаю, это является простым примером, чтобы показать сложную проблему. Но, если все элементы в 'vr' являются NA, как вы его замените на 'c' (здесь очевидно, что буквы следуют буквенному шаблону) – akrun