2015-07-07 8 views
0

Я пытаюсь оценить степень автокорреляции во временном ряду бинарных иерархически структурированных экологических данных. У меня есть данные о наличии или отсутствии (1 или 0) организма, измеренных на нескольких независимых участках (n = 469) каждые 6 месяцев в течение 11 лет (с учетом 22 одинаковых временных точек).Автокорреляция в двоичных временных рядах с несколькими группами

Вот некоторые фиктивные данные, чтобы работать с:

# Create dummy time series (random 0 or 1 value for absent or present) 
# Format of time series is matrix with rows as sites and columns as time points 

set.seed(1) 

dat <- matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22) 

Я хотел бы знать степень серийной корреляции в присутствии организма/отсутствие на каждом участке (время = т в зависимости от времени = т - 1, t - 2, t - 3, ..., t - 21). Хотя данные пространственно структурированы, мне все равно, что касается конкретных сайтов, а только общие отношения. Может ли кто-нибудь помочь мне определить подходящий способ форматирования данных для использования в пакете (например, «acf») или пользовательских функций, предназначенных для решения этой проблемы?

ответ

0

Как насчет этого?

set.seed(1) 

dat <- data.frame(id=1:469,matrix(sample(0:1, 469*22, replace=T), nrow=469, ncol=22)) 
library(tidyr);library(dplyr) 


dat %>% 
    gather(time,dummy,-id)->dat2 
library(lme4) 
model<-glmer(dummy~time+(1|id),dat2,family="binomial") 
vcov(model) #variance-covariance matrix 
+0

Благодарим за предложение. Мне нравится это направление, но я не уверен, что это дает мне правильный ответ. Из анализа GLMM (с использованием glmer) я знаю, что отсутствие присутствия в момент t-1 является большим предиктором отсутствия присутствия в момент времени t. Но это не получается в графике матрицы дисперсии-ковариации для модели, которую вы предложили. См. Здесь сюжет уровня (показывает мои настоящие данные, а не фиктивные данные): http://s10.postimg.org/pj468ak21/vocv_levelplot.jpg – MCNC