Я работаю над запуском RandomForest. Я импортировал данные точки, представляющие используемые и неиспользуемые сайты, и создал растровый стек из растровых ГИС-слоев. Я создал SpatialPointDataFrame со всеми используемыми и неиспользованными точками с привязанными к ним значениями растра.Как подзапрос SpatialPointsDataFrame в R
require(sp)
require(rgdal)
require(raster)
#my raster stack
xvariables <- stack(rlist) #rlist = a list of raster layers
# Reading in the spatial used and unused points.
ldata <- readOGR(dsn=paste(path, "DATA", sep="/"), layer=used_avail)
str([email protected])
#Attach raster values to point data.
v <- as.data.frame(extract(xvariables, ldata))
[email protected] = data.frame([email protected], v[match(rownames([email protected]), rownames(v)),])
Далее Я планирую запустить случайный лес, используя эти данные. Проблема в том, что у меня очень большой набор данных (более 40 000 точек данных). Мне нужно подставить образцы моих данных, но мне очень сложно понять, как это сделать. Я пробовал использовать функцию sample(), но я думаю, что, поскольку у меня есть SpatialPointsDataFram, он не будет работать? Я новичок в R и буду очень благодарен за любые идеи.
Спасибо!
Работа с комментариями вряд ли будет продуктивной. Чтобы воспроизвести вашу проблему, мне понадобится файл 'rlist' и' DATA'. Принимая во внимание, что «шейп-файл» на самом деле представляет собой набор файлов (так, DATA.dbf, DATA.prj, DATA.shp и т. Д.), Можете ли вы загрузить их где-нибудь и предоставить ссылку? – jlhoward