2015-04-13 10 views
0

Если у вас есть набор данных и обрезка 2% как сверху, так и снизу, для общей обрезки 4%, вы останетесь со средним 96% баллов. Означает ли это, что единственные оставшиеся баллы будут варьироваться от 0,02 квантиля до 0,98 квантилей исходного набора данных?Выполняет ли обрезку 2% баллов сверху и снизу, оставляя меня с квантилями .02 - .98?

Если это неверно, как бы я обрезал, чтобы иметь только данные из .02 quantile в .98 quantile?

Я использую R и хочу обрезать выбросы таким образом.

+6

Я голосую, чтобы закрыть этот вопрос как не по теме, потому что речь идет не о программировании. –

+2

Знаете ли вы о статистических и математических сайтах обмена ссылками? – reto

+0

Добавлен бит в конце. Я использую R для этого. – jsuprr

ответ

0

Действительно, квант вероятности 0,02 или второй процентиль - это значение, ниже которого найдено 2% ваших данных.

Для получения данных между 2-й и 98-й процентили, вы можете использовать quantile функцию:

# Random samples from a normal distribution 
x <- rnorm(1000) 
# Quantiles 
q <- quantile(x, probs = c(2, 98)/100) 
# Samples between quantiles 
x2 <- x[x>q[1] & x<q[2]] 

Edit: в отношении очистки выбросов вы можете захотеть, чтобы проверить комментарии this answer на подобный вопрос. Суть в том, что просто удаление фиксированного процента ваших данных, чтобы избавиться от выбросов, вероятно, неверно.

 Смежные вопросы

  • Нет связанных вопросов^_^