Может ли кто-нибудь посоветовать лучший способ сделать следующее?Случайно выберите увеличение подмножества данных, чтобы увидеть, где средние уровни отключены.
У меня есть три переменные (X, Y & Z) и четыре группы (1, 2, 3 & 4). Я использовал анализ дискриминантных функций в SPSS для прогнозирования членства в группе известных сгруппированных данных для использования с будущими негруппированными данными.
В идеале я хотел бы случайным образом опробовать все большее число подмножеств данных, чтобы увидеть, сколько наблюдений требуется для достижения желаемого правильного процента классификации.
Однако я понимаю, что это может быть сложно. Поэтому я собираюсь сделать это для средств.
Например, скажем, переменная X имеет среднее значение 141 для группы 1. Это значение могло быть рассчитано из 2000 наблюдений. Однако может случиться так, что среднее значение произошло, скажем, из 700 наблюдений. Я хотел бы иметь возможность рассчитать, какое количество наблюдений/случаев означает средние уровни в моих данных. Например, возможно, начиная с 10 наблюдений и повторяя это случайным образом 50 или 100 раз, затем увеличивая до 20 наблюдений .... и так далее.
Я понимаю, что это форма тестирования монте-карло. Я имею доступ к SPSS 15, 17 и 18 и превосхожу. У меня также есть доступ к minitab 15 & 16 и amos17 и скачали «R», но я не знаком с ними. Мой опыт в SPSS и Excel. Я попробовал некоторый синтаксис в SPSS, измененный из этого ..http: //pages.infinit.net/rlevesqu/Syntax/RandomSampling/Select2CasesFromEachGroup.txt, но с моей стороны было бы довольно много времени, чтобы ввести ect подмножества и т. Д.
Надеюсь, кто-то может помочь.
Спасибо за чтение.
Энди
R очень симпатичный для такого рода вещей. Если вы видите, что в будущем делаете больше такого рода вещей, стоит изучить, как его использовать. Если бы я использовал R, я бы взял случайную целую кучу случайных подмножеств группы, причем подмножества варьировались от малого до большого и вычисляли их среднее значение. Затем я нарисую их все на графике среднего/подмножества и посмотрю, сходятся ли они на что угодно. Реализация этого была бы довольно простой в любом реальном языке программирования, но ее трудно было бы сделать в подобных программам. – Oliver