Я хотел бы создать подмножество большого фрейма данных на основе двух столбцов Cola и ColB (см. Ниже). Для каждой переменной в ColA (например, A, B, C ...) я хотел бы извлечь строки, соответствующие каждому вхождению первой переменной в ColB. Поэтому DF1:R подмножество строк для всех вхождений первой переменной в столбец
ColA ColB ColC
A Red 7thing
A Red OneBot
A Blue BotOne
B Green Thing7
B Green Twosies
B Green Square
B Yellow Circle
B Yellow Polygon
B Purple Triangle
B White Octagon
C Orange Cube
C Black Line
стал бы DF2:
ColA ColB ColC
A Red 7thing
A Red OneBot
B Green Thing7
B Green Twosies
B Green Square
C Orange Cube
Я не обеспокоен дублей в ColC, и нет никакой закономерности числу вхождений переменной в ColB. Связанные стратегии подмножества, которые я нашел, сосредоточены на извлечении уникальных случаев, но я не нашел и не смог разработать подход, позволяющий выбрать все вхождения первого типа переменной и был бы благодарен за некоторую помощь.
Я попытался
DF2 <- DF1[match(unique(DF1$ColB), DF1$ColB),]
... и Подменят, который нацелен на переменном, когда содержимое переменного известно (например, Subset first n occurrences of certain value in dataframe in R), они не подходят по-видимому.
какой код вы пробовали? SO - ресурс кодирования, а не служба кодирования. – Nate
Я отредактировал свое сообщение, чтобы включить некоторый код, и мог бы добавить больше, если это полезно, но проблема не является ошибкой в соответствующем коде, поэтому я ее не включил. Извинения, если мой вопрос натолкнулся на ожидание службы, это не так, рекомендации SO, как представляется, включают в себя код, который не подходит для каждого вопроса, и это то, что я использовал в качестве моего руководства. – SPZ