Предположим, мы имеем следующий набор данных в R:Учитывая минимум столбца, найти минимум в других colunm (dplyr)
> td
Type Rep Value1 Value2
1 A 1 7 1
2 A 2 5 4
3 A 3 5 3
4 A 4 8 2
5 B 1 5 10
6 B 2 6 1
7 B 3 7 1
8 C 1 8 13
9 C 2 8 13
> td <- structure(list(Type = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L,
3L, 3L), .Label = c("A", "B", "C"), class = "factor"), Rep = c(1L,
2L, 3L, 4L, 1L, 2L, 3L, 1L, 2L), Value1 = c(7L, 5L, 5L, 8L, 5L,
6L, 7L, 8L, 8L), Value2 = c(1L, 4L, 3L, 2L, 10L, 1L, 1L, 13L,
13L)), .Names = c("Type", "Rep", "Value1", "Value2"), class = "data.frame",
row.names = c(NA, -9L))
Я хотел бы произвести следующую таблицу:
Type MinValue1 MinValue2 MeanValue1 MeanValue2
1 A 5 3 6.25 2.5
2 B 5 10 6.00 4.0
3 C 3 13 8.00 13.0
В этой таблице данные суммируются с помощью «Тип». Столбец «MinValue1» является минимальным значением для определенного типа, а столбец «MinValue2» является минимальным значением «Value2», учитывая минимальное значение (значения) столбца «Value1». Столбцы Средние * - общая средняя всех наблюдений.
Один из способов сделать это - реализовать циклы, которые перебирают каждый тип и выполняют математику. Тем не менее, я ищу лучший/простой/красивый способ выполнить такую операцию.
я играл с инструментами из "tidyverse":
> library(tidyverse)
> td %>%
group_by(Type) %>%
summarise(MinValue1 = min(Value1),
MeanValue1 = mean(Value1),
MeanValue2 = mean(Value2))
# A tibble: 3 × 4
Type MinValue1 MeanValue1 MeanValue2
<fctr> <int> <dbl> <dbl>
1 A 5 6.25 2.5
2 B 5 6.00 4.0
3 C 8 8.00 13.0
Заметим, что мы не имеем столбец "MinValue2" здесь. Также обратите внимание, что «суммировать (..., MinValue2 = min (Value2), ...)» не работает, поскольку это решение принимает минимум всех наблюдений одного типа.
Мы можем играть с «кусочком», а затем объединить результаты:
> td %>% group_by(Type) %>% slice(which.min(Value1))
Source: local data frame [3 x 4]
Groups: Type [3]
Type Rep Value1 Value2
<fctr> <int> <int> <int>
1 A 3 5 4
2 B 1 5 10
3 C 1 8 13
, но обратите внимание, что инструмент «срез» не поможет нам здесь: «Тип A, Значение1 5» должен иметь «значение2» == 3, а не == 4 как возврат фрагментов.
Итак, вы, ребята, элегантный способ добиться результатов, которые я ищу? Благодаря!
спасибо. Последний вариант - тот, который я ищу. –