2015-07-07 3 views
7

Я считаю, что метод «rf» (randomForest) в caret устанавливает количество деревьев по умолчанию, равное 500. К сожалению, это приводит к тому, что временная сложность вырастает из-под контроля для больших наборов данных. Есть ли быстрый способ уменьшить количество деревьев без создания настраиваемого метода? Я знаю, что единственным настраиваемым параметром для rf является mtry.Как вы можете уменьшить параметр ntree = 500 по умолчанию, переданный RF из каретки?

Просто уточнить: я не хочу настраивать количество деревьев. Я просто хочу исправить его до более низкого значения, чтобы я мог запустить rf за разумное время.

ответ

11

Вы можете задать параметр ntree при вызове поезд, как так:

rf <- train(X, y, method="rf", preProcess=c("center","scale"), ntree=100, trControl=fitControl) 
0

Одно из предложений было бы использовать библиотеку randomForest. Я всегда обнаружил, что один более простой в использовании, чем один в caret, и у него есть параметр для установки количества деревьев.

+0

согласился, но я пытаюсь использовать CARET методу, как я построил ансамбль рабочего метода, который использует единый интерфейс что обеспечивает карет. –

+0

Почему вы не можете просто изменить код тогда :) –

+1

А, я вижу лучшие предложения выше .... –