Когда я запускаю случайную модель леса по своим тестовым данным, у меня получается разные результаты для одного и того же набора данных + модели.Различные результаты с использованием прогноза случайного леса в R
Вот результаты, где вы можете увидеть разницу по первому столбцу:
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 14 7
TRUE 13 66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 15 7
TRUE 12 66
Хотя разница очень мала, я пытаюсь понять, что стало причиной этого. Я предполагаю, что predict
имеет «гибкий» порог классификации, хотя я не мог найти это в документации; Я прав?
Спасибо заранее
Пожалуйста, прочитайте документацию пакет 'randomForest' немного ближе. Это прекрасно объясняет, почему это документированное поведение. Ваш randomForest - это набор деревьев, и каждый раз, когда вы запускаете модель, вы получите немного другой набор деревьев. Это не имеет ничего общего с функцией прогнозирования, это просто то, как работают случайные леса. Кроме того, вопросы о статистических методах относятся к stats.stackexchange.com, а не к stackoverflow. –