Я создал random forest
из моих данных:Получить точность случайного леса в R
fit=randomForest(churn~., data=data_churn[3:17], ntree=1,
importance=TRUE, proximity=TRUE)
Я могу легко увидеть мой confusion matrix
:
conf <- fit$confusion
> conf
No Yes class.error
No 945 80 0.07804878
Yes 84 101 0.45405405
Теперь мне нужно знать, точность для случайного леса. Я обыскал и понял, что библиотека caret имеет метод confusionMatrix
, который получает матрицу путаницы и возвращает точность (наряду со многими другими значениями). Однако для этого метода нужен еще один параметр: "reference"
. Мой вопрос в том, как я могу предоставить ссылку на метод для получения точности моего случайного леса? И ... это правильный способ получить точность случайного леса?
Если вы просто наберите 'fit' в командной строке, как спутанность матрицы и из мешка (OOB) ошибка будет распечатать. Ошибка OOB - общая ошибка классификации. Вы также можете вычислить ошибку OOB из матрицы путаницы. В вашем случае это 164/1210 (количество ошибочных наблюдений за общее количество наблюдений). Однако, если вы действительно хотите знать, насколько хороша ваша модель, у вас должны быть отдельные данные обучения для создания модели и тестовых данных (которые не использовались в процессе построения модели) для проверки производительности модели. – eipi10
@ eipi10 Спасибо! Поэтому я предполагаю, что точность будет ошибкой 1-OOB. Я прав? –
Да. Правильно. – eipi10