2012-11-26 1 views
13

У меня есть кадр данных с непрерывной числовой переменной, возраст в месяцах (age_mnths). Я хочу создать новую дискретную переменную с возрастными категориями в зависимости от возрастных интервалов.Преобразование непрерывных числовых значений в отдельные категории, определенные интервалами

# Some example data 
rota2 <- data.frame(age_mnth = 1:170) 

Я создал процедуру, основанную ifelse (ниже), но я считаю, что есть возможность для более элегантного решения.

rota2$age_gr<-ifelse(rota2$age_mnth < 6, rr2 <- "0-5 mnths", 

    ifelse(rota2$age_mnth > 5 & rota2$age_mnth < 12, rr2 <- "6-11 mnths", 

      ifelse(rota2$age_mnth > 11 & rota2$age_mnth < 24, rr2 <- "12-23 mnths", 

       ifelse(rota2$age_mnth > 23 & rota2$age_mnth < 60, rr2 <- "24-59 mnths", 

         ifelse(rota2$age_mnth > 59 & rota2$age_mnth < 167, rr2 <- "5-14 yrs", 

           rr2 <- "adult"))))) 

Я знаю, что есть cut функция, но я не мог справиться с ним для моей целью Дискретизируем/категоризировать.

+0

Основная ошибка здесь является использование оператора присваивания в значениях для «да» и «нет» параметров –

ответ

30

Если есть причина, по которой вы не хотите использовать cut, тогда я не понимаю, почему. cut будет работать штраф за то, что вы хотите сделать

# Some example data 
rota2 <- data.frame(age_mnth = 1:170) 
# Your way of doing things to compare against 
rota2$age_gr<-ifelse(rota2$age_mnth<6,rr2<-"0-5 mnths", 
        ifelse(rota2$age_mnth>5&rota2$age_mnth<12,rr2<-"6-11 mnths", 
          ifelse(rota2$age_mnth>11&rota2$age_mnth<24,rr2<-"12-23 mnths", 
            ifelse(rota2$age_mnth>23&rota2$age_mnth<60,rr2<-"24-59 mnths", 
              ifelse(rota2$age_mnth>59&rota2$age_mnth<167,rr2<-"5-14 yrs", 
               rr2<-"adult"))))) 

# Using cut 
rota2$age_grcut <- cut(rota2$age_mnth, 
         breaks = c(-Inf, 6, 12, 24, 60, 167, Inf), 
         labels = c("0-5 mnths", "6-11 mnths", "12-23 mnths", "24-59 mnths", "5-14 yrs", "adult"), 
         right = FALSE) 
10
rota2$age_gr<-c("0-5 mnths", "6-11 mnths", "12-23 mnths", "24-59 mnths", "5-14 yrs", 
       "adult")[ 
      findInterval(rota2$age_mnth , c(-Inf, 5.5, 11.5, 23.5, 59.5, 166.5, Inf)) ] 
+1

Это немного отличается от ' вырезать, чтобы интервалы были закрыты слева и открывались справа, если не указано иное. –

+1

Но вы всегда можете написать версию findInterval, которая закрыта справа и откроется слева - http://stackoverflow.com/questions/13482872/findinterval-with-right-closed-intervals – Dason