2012-10-23 6 views
3

У меня есть простой вопрос, хотя я не могу найти ответ нигде. У меня есть следующий набор данных:Распределение выборки среднего значения выборки

data.set <- c(7,7,8,8,7,8,9) 

Вопрос из книги Basic Статистика является: Что выборочное распределение выборочного среднего для образцов размером 2? Есть ли возможность вычислить это в R commander (или с помощью командной строки).

ответ

1

Этот

mean2 <- function(x,y){ (x+y)/2 } 
table(outer(data.set, data.set, "mean2"))/length(data.set)^2 

даст

  7  7.5   8  8.5   9 
0.18367347 0.36734694 0.30612245 0.12244898 0.02040816 

, который может быть вид, что вы ищете. Вероятности являются 1/49 от 9, 18, 15, 6 и 1.


Добавлено: без замены

mean2 <- function(x,y){ (x+y)/2 } 
L  <- length(data.set) 
table(outer(data.set, data.set, "mean2")[- ((L+1)*(1:L)-L) ])/(L*(L-1)) 

, чтобы дать

 7  7.5   8  8.5 
0.1428571 0.4285714 0.2857143 0.1428571 

, которые являются 1/7 , 4/7, 2/7, 1/7 соответственно,

+1

Если вы используете образец с заменой. – Backlin

+0

@IrisPriest Если книга действительно дает как * распределение выборки образца среднее * просто число «21», книга - мерзость, и вы должны убить ее огнем. –

+1

@Glen_b Прошу прощения за путаный комментарий (удалено). Очевидно, что в качестве ответа книга дает фактическое распределение выборки. Я просто хотел подчеркнуть, что это без замены. Спасибо, Iris –

4

Вот несколько способов взглянуть на распределение выборки при выполнении простой случайной выборки без замена:

# Exact 
data.set <- c(7,7,8,8,7,8,9) 
samps <- combn(data.set, 2) 
xbars <- colMeans(samps) 
table(xbars) 
prop.table(table(xbars)) 
barplot(table(xbars)) 

# Simulated 
data.set <- c(7,7,8,8,7,8,9) 
out <- replicate(10000, mean(sample(data.set, 2))) 
prop.table(table(out)) 
hist(out) 

Точная версия работает отлично подходит для небольших групп населения (как этот), но не будет иметь практическое значение для больших групп населения/образцы, например, если ваш размер населения равен 100, а ваши образцы имеют размер 10, и вы можете рассчитать 10 000 единиц в секунду, для выполнения точной версии все равно потребуется почти 55 лет, поэтому в этом случае имитированная версия будет намного лучше.

+0

Г-н Сноу и г-н Генри очень благодарны вам за ваши быстрые ответы. Они высоко ценятся. С уважением, Iris –