Вот несколько способов взглянуть на распределение выборки при выполнении простой случайной выборки без замена:
# Exact
data.set <- c(7,7,8,8,7,8,9)
samps <- combn(data.set, 2)
xbars <- colMeans(samps)
table(xbars)
prop.table(table(xbars))
barplot(table(xbars))
# Simulated
data.set <- c(7,7,8,8,7,8,9)
out <- replicate(10000, mean(sample(data.set, 2)))
prop.table(table(out))
hist(out)
Точная версия работает отлично подходит для небольших групп населения (как этот), но не будет иметь практическое значение для больших групп населения/образцы, например, если ваш размер населения равен 100, а ваши образцы имеют размер 10, и вы можете рассчитать 10 000 единиц в секунду, для выполнения точной версии все равно потребуется почти 55 лет, поэтому в этом случае имитированная версия будет намного лучше.
Если вы используете образец с заменой. – Backlin
@IrisPriest Если книга действительно дает как * распределение выборки образца среднее * просто число «21», книга - мерзость, и вы должны убить ее огнем. –
@Glen_b Прошу прощения за путаный комментарий (удалено). Очевидно, что в качестве ответа книга дает фактическое распределение выборки. Я просто хотел подчеркнуть, что это без замены. Спасибо, Iris –