Этот вопрос является расширением для заданного вопроса StackOverflow и ответа here.Эффективно вычислять процентиль столбца DataFrame
Мои обстоятельства отличаются тем, что я хочу рассчитать процентиль каждого значения в векторе из 50 000 (или более!) Значений. Например,
df <- data.frame(val = rnorm(n = 50000, mean = 50, sd = 20))
df$val.percentile <- sapply(X = df$val, function(x) ecdf(df$val)(x))
head(df)
Есть ли хороший способ оптимизировать процесс вычисления процентиля для каждого значения? По сути, я хотел бы сделать его максимально эффективным, чтобы время работы было как можно меньше.
Как этот ответ отличался от моего? –
@ 42- Это не так, но вы и Баркер выложили почти в то же время (с первым Баркером) – Jaap
Да, я не видел его, когда отправлял (или редактировал). Я предполагал, что это произошло позже. –