2014-01-03 2 views
3

Есть ли у кого-нибудь представление о том, как сделать стратифицированную выборку у свиньи? (wikipedia)стратифицированный отбор проб у свиней?

На данный момент, я что-то вроде:

relation2 = SAMPLE relation1 0.05; 

, но мой набор данных содержит метку столбцов с несколькими вхождений, некоторые из них встречаются редко (0,5%, например), и я бы как мой случайный выбор, чтобы не забыть их всех.

Большое спасибо.

ответ

1

Вы можете реализовать свой собственный метод выборки с помощью RANDOM() и затем отфильтровывать строки со значениями ниже, скажем, 0,95. Таким образом, если вы хотите расслоить эту выборку, вы можете вычислить, какая часть ваших строк содержит определенное значение, а затем соответствующим образом масштабировать ваше случайное значение, чтобы различные значения получали выборку с разной скоростью.