2016-05-05 5 views
0

Я хочу выбрать свой образец в Stata 13 на основе трех переменных страты с 12 стратами в целом (размер - две страты, сектор - три слоя, неосязаемая интенсивность - две страты). Выбор должен быть пропорционален без замены.Как сделать пропорциональную стратифицированную выборку без замены?

Однако я могу найти только непропорциональные команды выбора, которые выбирают, например, x% каждой страты.

Может ли кто-нибудь помочь мне с этой проблемой?

+0

Что соразмерная выборка, за исключением выбора ту же долю в каждом слое? –

+0

Пропорциональные средства (по крайней мере, из моего понимания, пожалуйста, поправьте меня, если я ошибаюсь), вы выбираете предметы в каждой страте, основываясь на распределении среди населения, например. 35% населения - крупные компании, поэтому в конечном итоге 35% крупных компаний должны быть в вашей выборке. – Tobias

+0

В этом случае стратификация не имеет значения. Я думаю, что путаница здесь может быть статистической ошибкой, что вы хотите, чтобы случайная выборка была миниатюрной копией населения. Найдите серию работ Крускаля и Мостеллера в «International Statistical Review» 1979f. –

ответ

0

Благодарим вас за обсуждение. Кажется, я знаю, где моя проблема.

Команда «gsample» может выбирать страты на основе разных переменных. Поэтому я думал, что мне нужно определить три разные страты. Но решение должно быть более простым.

Всего 12 групп (крупные фирмы с высокой интенсивностью в секторе 1, небольшие фирмы с высокой интенсивностью в секторе 1 и т. Д.) С каждой фирмой в образце, входящем в один из слоев.

Все, что мне нужно сделать, это создать переменную «strataident» со значениями от 1 до 12, идентифицируя разные слои. Я делаю это для набора данных населения, поэтому число фирм, попадающих в каждый слой, является представительным для населения. Следующий код предоставит мне стратифицированную случайную выборку, которая является представительной для населения.

gsample 10, percent strata (strataident) wor

Эта команда работает так же и гораздо проще, смотрите пример в 1:

gsample 10, percent wor strata(size sector intensity) 
+0

Закрытие - это негативное действие; в противном случае все потоки остаются неопределенными, поскольку другие могут пожелать добавить дополнительные ответы (или отредактировать их) в зависимости от репутации. Вы можете принять свой собственный ответ. http://stackoverflow.com/help/accepted-answer –

+0

Спасибо, я оставлю его открытым. – Tobias

+0

См. Http://stackoverflow.com/help/closed-questions о том, что подразумевается под закрытием. –

-1

Проблема в том, что страты могут «перекрываться». Поэтому вам, вероятно, придется перебалансировать образец после первоначального проекта.

Теперь вопрос в том, как это можно реализовать. В последнем образце должна быть представлена ​​максимально возможная доля населения.

+0

По определению страты в стратифицированной выборке разбивают совокупность и не перекрываются. –

+0

То, что я написал, было неправильным. Я имел в виду, что стратификация многомерна, и каждый человек является частью одного страта в каждом измерении. – Marco