У меня есть две таблицы, оба имеют следующие поля:DPLYR искать или присоединяться? Как подойти к этому?
- Дата
- ID
- овощи
- фрукты
- Метрика
df2 является подмножеством df1. df1 имеет ~ 8k записей, а df2 имеет около 4k.
Моя цель - либо создать новый df, либо добавить столбец в родительский фрейм данных df1 с истинным/ложным для того, выходит ли комбинация даты/идентификатора в df2. Поиск в основном.
Должен ли я идти по маршруту поиска или мне нужно создать новый фрейм данных, присоединив df1 и 2?
Я не могу присоединиться только к id, должен быть комбинацией идентификатора и даты, поскольку некоторые идентификаторы возвращаются в разные даты.
Я попытался left_join()
comb <- left_join(x = df1, y = df2, by=c("date", "id"))
Но результат, возвращаемый столбцы для фруктов и овощей для обоих, когда я на самом деле просто хотел сохранить df1 колонки:
- Дата
- ID
- овощи .x
- fruits.x
- metric.x
- vegetables.y
- fruits.y
- metric.y
То, что я хочу, это просто:
- Дата
- ID
- овощи
- фрукты
- InDF2 (булево)
- метрика
Что является лучшим способом, чтобы определить, какие строки (дата + идентификатор) в df1 также существуют в df2 (дата + идентификатор)?
Это сделал трюк поблагодарить вас за предложение, использовали это в сочетании с мутировать(), чтобы добавить новый колонка. –