Благодарим вас за обсуждение. Кажется, я знаю, где моя проблема.
Команда «gsample» может выбирать страты на основе разных переменных. Поэтому я думал, что мне нужно определить три разные страты. Но решение должно быть более простым.
Всего 12 групп (крупные фирмы с высокой интенсивностью в секторе 1, небольшие фирмы с высокой интенсивностью в секторе 1 и т. Д.) С каждой фирмой в образце, входящем в один из слоев.
Все, что мне нужно сделать, это создать переменную «strataident» со значениями от 1 до 12, идентифицируя разные слои. Я делаю это для набора данных населения, поэтому число фирм, попадающих в каждый слой, является представительным для населения. Следующий код предоставит мне стратифицированную случайную выборку, которая является представительной для населения.
gsample 10, percent strata (strataident) wor
Эта команда работает так же и гораздо проще, смотрите пример в 1:
gsample 10, percent wor strata(size sector intensity)
Что соразмерная выборка, за исключением выбора ту же долю в каждом слое? –
Пропорциональные средства (по крайней мере, из моего понимания, пожалуйста, поправьте меня, если я ошибаюсь), вы выбираете предметы в каждой страте, основываясь на распределении среди населения, например. 35% населения - крупные компании, поэтому в конечном итоге 35% крупных компаний должны быть в вашей выборке. – Tobias
В этом случае стратификация не имеет значения. Я думаю, что путаница здесь может быть статистической ошибкой, что вы хотите, чтобы случайная выборка была миниатюрной копией населения. Найдите серию работ Крускаля и Мостеллера в «International Statistical Review» 1979f. –