У меня есть (возможно, простой) вопрос, который я не могу понять.Как написать цикл к случайному образцу из нескольких подмножеств данных?
Я хотел бы написать цикл (или использовать mapply или ddply?) Для случайного отбора трех значений из каждого из нескольких подмножеств данных и найти среднее значение для этой случайной выборки и поместить ее в кадр данных.
Например, вот небольшая часть данных:
BayStation DIN Year
1 60069 0.0090 1998
2 60069 0.0060 1998
3 60069 0.0100 1998
4 60069 0.0020 1998
5 60069 0.0140 1998
6 60069 0.0110 1998
7 60081 0.0140 1998
8 60081 0.0140 1998
9 60081 0.0060 1998
10 60081 0.0020 1998
11 60081 0.0250 1998
12 60081 0.0140 1998
13 60081 0.0110 1998
Хочу подмножества по BayStation, случайным образом образец три значения для каждого DIN BayStation, и вычислить среднее значение. Я знаю, как сделать это для один лавровых станций:
test<-mean(sample(DIN1998$DIN[DIN1998$BayStation=="60081"],
3, replace = FALSE, prob = NULL))
Но я хотел бы знать, как я мог бы сделать это в течение всего dataframe, с сотнями станций. Может ли кто-нибудь сказать мне, как это сделать? Или дать большой намек? Безопасно сказать, мои навыки R очень просты - спасибо заранее!