Предположим, у нас есть матрица с 3 столбцами и 100 строк. Пусть имена столбцов: a_dem
, b_dem
и c_blah
. А давайте представим, что каждая ячейка может иметь значение от 0 до 100.Выбор и фильтрация по тем же переменным в dplyr
Есть ли способ использовать select()
, filter()
и %>%
выбрать только наблюдение, которые заканчиваются «_dem» и имеют значения больше, чем, скажем, 50?
Я бы своего рода представлял себе, что было бы по этим линиям:
dat %>%
select(ends_with("dem")) %>%
filter(>50) %>%
summary()
, но это не работает, очевидно.
Итак, есть ли способ сделать такой выбор и фильтрацию, или мне придется прибегнуть к чему-то более сложному?
Лучшая вещь, которую я знаю, это использовать 'собирать()' и ' spread() 'из' tidyr', чтобы превратить ваши «дем» переменные в значения и отфильтровать только один столбец. – sgp667
ячейки имеют только числовые значения, поэтому по существу вы хотите просто выбрать первые два столбца? –
@ sgp667 Я посмотрю, спасибо, спасибо! LloydChristmas: Идея состоит в том, чтобы выбрать первые два столбца и взять только наблюдения, которые имеют значение больше 50 в обоих этих столбцах. – Potato