2016-12-21 1 views
5

Я хотел бы отфильтровать фрейм данных, чтобы оставить только полные случаи на основе выбранных столбцов. Это легко сделать с помощью NSE filter():SE filter_ по функции, принимающей несколько столбцов

library(dplyr) 

dd <- data.frame(
    id = 1:4, 
    var1 = c(1, 2, NA, 4), 
    var2 = c(1, NA, 3, 4), 
    var3 = c(1, NA, NA, NA)) 

dd1 <- dd %>% filter(complete.cases(var1, var2)) 
dd1 
#> id var1 var2 var3 
#> 1 1 1 1 1 
#> 2 4 4 4 NA 

Однако я бегу в к стене, пытаясь произвести версию SE этой операции, к которым я могу передать цитируемые имена столбцов.

library(lazyeval) 
filtered_cols <- c("var1", "var2") 

dots <- interp(~complete.cases(x), .values = list(x = filtered_cols)) 

dd2 <- dd %>% filter_(.dots = dots) 
#> Error in eval(substitute(expr), envir, enclos): incorrect length (2), expecting: 4 

str(dots) 
#> Class 'formula' language ~complete.cases(c("var1", "var2")) 
#> ..- attr(*, ".Environment")=<environment: R_GlobalEnv> 

К сожалению, filtered_cols становится анализируется как вектор символов. Как я могу получить interp() для лечения filtered_cols как имена нескольких столбцов, которые должны быть переданы в complete.cases()?

+1

@akrun аккуратный! Но это не работает, когда 'length (filt_cols) == 1' – mdlincoln

ответ

5

Это то, что uqs() это, но вы должны использовать новый f_interp():

library(lazyeval) 
filtered_cols <- c("var1", "var2") 
filtered_col_names <- lapply(filtered_cols, as.name) 

dots <- f_interp(~complete.cases(uqs(filtered_col_names))) 

dd2 <- dd %>% filter_(.dots = dots)