2015-04-02 4 views
2

Я хотел бы выполнить регрессионный кригинг (RK) для двоичного отсутствия присутствия и данных сетки хоста в качестве постоянного предиктора. Я использовал логистическую функцию для оценки взаимосвязи между двоичным исходом и предсказателем, однако, я думаю, что он не передает предположения РК? Предикторная переменная не является существенной в модели. Есть ли альтернатива, как подойти к нему?Логистическая функция для регрессионного кригинга

Данные по коду: https://drive.google.com/folderview?id=0B7-8DA0HVZqDYk1BcFFwSkZCcjQ&usp=sharing

presabs <- read.csv("Pres_Abs.csv",header=T, 
          colClasses = c("integer","numeric","numeric", 
              "integer")) 

coordinates(presabs) <- c("Long","Lat") # creates SpatialPointsDataFrame 

host <- read.asciigrid("host.asc.txt") # reads ArcInfo Ascii raster map 

host.ov <- overlay(host, presabs) # create grid-points overlay 
presabs$host.asc.txt <- host.ov$host.asc.txt #copy host values 
presabs$host.asc.txt <- log(host.ov$host.asc.txt) 

glm(formula = Pres ~ host.asc.txt, family = binomial, data = presabs) 
summary(glm.presabs) 

Weighted Residuals: 
    Min  1Q Median  3Q  Max 
-0.3786 -0.3762 -0.3708 -0.3497 3.3137 

Coefficients: 
       Estimate Std. Error t value Pr(>|t|)  
(Intercept) -1.942428 0.320104 -6.068 1.38e-08 *** 
host.asc.txt -0.001453 0.003034 -0.479 0.633  
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 1.007 on 127 degrees of freedom 
Multiple R-squared: 1.317e-05, Adjusted R-squared: -0.007861 
F-statistic: 0.001673 on 1 and 127 DF, p-value: 0.9674 

Тогда, когда дело доходит до фактического кригинге, я построить этот код из учебника, но это, кажется, фактические остатки от GLM не подается в krige функция. Можно ли улучшить gstat?

library(gstat) 

# Set bin width for the variogram and max distance: 
Bin <- 0.09 
MaxDist <- 1 
BinNo <- MaxDist/Bin 

# Calculate and plot the variogram 
surpts.var <- variogram(Pres~1, presabs, cutoff=MaxDist, width = Bin) 
plot(surpts.var) 

# Insert parameter values for the variogram model 
psill = 0.05921 
distance = 63.7/111 
nugget = 0.06233 # constant 

# Fit and plot variogram model: 
null.vgm <- vgm(psill,"Sph",distance,nugget) # initial parameters 
vgm_Pres_r <- fit.variogram(surpts.var, model=null.vgm, fit.ranges=TRUE, 
          fit.method=1) 
plot(surpts.var,vgm_Pres_r) 

# Run RK using universal kriging: 
presabs_uk <- krige(Pres~host.asc.txt, locations=presabs, 
         newdata=host, model=vgm_Pres_r) 
+0

Существует несколько проблем с первым сценарием: во-первых, вы забыли 'library (sp)', то точечные данные не попадают в удобный формат на вашем диске Google, а затем 'presabs $ host.asc.txt <- log (host.ov $ host.asc.txt) 'не соответствует выходу glm ниже, тогда вы, кажется, называете' summary.lm' на объекте 'glm' вместо соответствующего' summary', тогда 'glm .presabs' отсутствует. Похоже, вы копируете и вставляете команды, не проверяя их совместимость и воспроизводимость. –

ответ

1

krige упоминает, что

[using universal kriging] 

Это означает, что она соответствует линейной модели, но не обобщенной линейной модели. Он использует вариограмму, которую вы привязали к необработанным данным, а не к остаткам. Остаточная вариограмма была бы получена путем

surpts.var <- variogram(Pres~host.asc.txt, presabs, cutoff=MaxDist, width = Bin) 

но почти идентично, так как переменная и отображение сетки почти коррелированны:

> cor(presabs$Pres,presabs$host.asc.txt) 
[1] -0.04281038 

так, это не сюрприз, что вы не распознать карту сетки в предсказаниях универсального кригинга: они почти (линейно) независимы.