2014-12-11 2 views
0

У меня есть несколько моделей randomForest, которые имеют одинаковые независимые переменные (X), различные зависимые переменные (Y). Есть ли способ эффективно управлять этой моделью без кластера? В настоящее время я использую lapply для их последовательного запуска.Как запустить randomForest эффективно без кластера

library(randomForest) 
data(iris) 

iris_new<-iris[,c(1:ncol(iris),rep(ncol(iris),4))] 

tt<-lapply(1:5, function (i){ 
iris.rf <- randomForest(as.formula(paste(colnames(iris_new)[4+i],'.',sep='~')), data=iris_new, importance=TRUE) 
iris.pred <- predict(iris.rf, iris_new[i,]) 

}) 

В приведенном выше примере существует 5 моделей randomforest. первые четыре столбца являются независимыми переменными для разных моделей. Последние 5 столбцов являются зависимыми переменными для каждой модели.

ответ

0

Одним из возможных решений может быть использование допара из параллельного пакета. Это позволит вам использовать все ваши ядра для выращивания деревьев. Если у вас есть четыре ядра, вы можете использовать каждый из них, чтобы каждый раз вырастить дерево, а затем объединить их, используя функцию комбинирования пакета.