2015-07-21 3 views
1

Я сравниваю пары данных столбцов с тестом на сумму звания wilcoxon, и я получал то же самое значение для большинства сравнений. Мне было интересно, судя по данным, допустил ли я ошибку или все в порядке. Вот некоторые из сравнений.Результаты оценки ранга Wilcoxon: одно и то же значение снова и снова?

Это сравнение, которое я использовал

wtresult<-wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE) 

А вот результаты с данными, используемыми над ним.

X1  X2  X3      
339.53 354.11 435.56 425.34 434.64 436.08 
X1 X2 X3     
312.1 282.2 281.6 NA NA NA 

Wilcoxon rank sum test 

data: datachunk[, i] and datachunk[, (i + 1)] 
W = 18, p-value = 0.02381 
alternative hypothesis: true location shift is not equal to 0 

X1  X2  X3      
161.21 150.01 183.47 201.51 234.70 321.00 
X1 X2 X3     
501.0 520.1 500.7 NA NA NA 

Wilcoxon rank sum test 

data: datachunk[, i] and datachunk[, (i + 1)] 
W = 0, p-value = 0.02381 
alternative hypothesis: true location shift is not equal to 0 

X1  X2  X3      
247.79 159.64 192.00 262.86 403.33 336.21 
X1 X2 X3     
60.33 66.04 55.23 NA NA NA 

Wilcoxon rank sum test 

data: datachunk[, i] and datachunk[, (i + 1)] 
W = 18, p-value = 0.02381 
alternative hypothesis: true location shift is not equal to 0 

X1 X2 X3     
17.12 15.83 16.88 17.61 18.97 45.92 
X1 X2 X3     
321.8 329.7 334.4 NA NA NA 

ответ

2

Тест немного «коренастый» для небольшого числа наблюдений, так что если у вас есть граничный случай (все первых значения аргументов больше, чем второе значение аргументов или наоборот), вы получите идентичную р -значения и статистические данные W, которые являются всеми 0 или некоторым другим числом (в зависимости от n).

Для получения более подробного ответа нам нужно будет увидеть ваши данные или вам нужно будет согласиться просмотреть некоторые другие данные, которые мы все можем видеть.

Вот пример кода, который показывает поведение я говорю о

i <- 1 
datachunk <- mtcars[1:5,] 
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE) 

i <- 2 
wilcox.test(datachunk[,i],datachunk[,(i+1)],paired=FALSE) 
1

Так как в вашем примере в каждом тесте, все значения из одной группы больше, чем все значения из другой группы, подписанные ранги, назначенные для каждой разницы, будут одинаковыми независимо от фактических числовых значений. Поэтому ваши статистические данные теста и значения p одинаковы.

Таким образом, математически это имеет смысл, но я бы подумал, если применение теста имеет смысл с таким небольшим размером выборки.

 Смежные вопросы

  • Нет связанных вопросов^_^