Я действительно новичок в R, поэтому, пожалуйста, несите меня. Я использую тест хи-квадрат для сравнения нуклеотидных частот в заданном положении, и я подсчитал число A, C, G, T в двух различных наборов данных:Тест с двумя образцами chi-squared в R
x1 <- c(272003,310418,201601,237168)
x2 <- c(239614,316515,182070,198025)
Я могу думать о двух способы попросить хи-квадрат тест два образца:
> chisq.test(x1,x2)
Pearson's Chi-squared test
data: x1 and x2
X-squared = 12, df = 9, p-value = 0.2133
Warning message:
In chisq.test(x1, x2) : Chi-squared approximation may be incorrect
или
> chisq.test(cbind(x1,x2))
Pearson's Chi-squared test
data: cbind(x1, x2)
X-squared = 2942.065, df = 3, p-value < 2.2e-16
Я подозреваю, что вторая версия верна, потому что я тоже могу это сделать:
> chisq.test(x1,x1)
Pearson's Chi-squared test
data: x1 and x1
X-squared = 12, df = 9, p-value = 0.2133
Warning message:
In chisq.test(x1, x1) : Chi-squared approximation may be incorrect
с идентичным и явно неправильным результатом.
Что на самом деле рассчитывается в этом случае?
Спасибо!