2017-01-24 15 views
4

Когда я запускаю случайную модель леса по своим тестовым данным, у меня получается разные результаты для одного и того же набора данных + модели.Различные результаты с использованием прогноза случайного леса в R

Вот результаты, где вы можете увидеть разницу по первому столбцу:

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR) 

     FALSE TRUE 
FALSE 14 7 
TRUE  13 66 

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR) 

     FALSE TRUE 
FALSE 15 7 
TRUE  12 66 

Хотя разница очень мала, я пытаюсь понять, что стало причиной этого. Я предполагаю, что predict имеет «гибкий» порог классификации, хотя я не мог найти это в документации; Я прав?

Спасибо заранее

+1

Пожалуйста, прочитайте документацию пакет 'randomForest' немного ближе. Это прекрасно объясняет, почему это документированное поведение. Ваш randomForest - это набор деревьев, и каждый раз, когда вы запускаете модель, вы получите немного другой набор деревьев. Это не имеет ничего общего с функцией прогнозирования, это просто то, как работают случайные леса. Кроме того, вопросы о статистических методах относятся к stats.stackexchange.com, а не к stackoverflow. –

ответ

5

я буду считать, что вы не переоборудовать модель здесь, но это просто predict вызов, который производит эти результаты. Ответ, вероятно, это, из ?predict.randomForest:

Любые отношения разбиты в случайном порядке, поэтому, если это нежелательно, во избежание его используя нечетное число ntree в RandomForest()

 Смежные вопросы

  • Нет связанных вопросов^_^