2015-04-21 8 views
2

Я использую случайный пакет леса в R для регрессии, он дает мне два вида информации: Mean of squared residuals и% Var объясняется. Но я хочу рассчитать RMSE и R^2 учебных и тестовых комплектов, может ли кто-нибудь помочь мне, как я могу найти такую ​​информацию?случайный пакет леса в R

+3

Просьба представить минимально воспроизводимый пример вашего кода с библиотечными зависимостями и любыми функциями, которые вы использовали. – mlegge

ответ

2

Извините, но это не является конкретным ответом, но у меня недостаточно кредитов, чтобы оставить комментарий.

Трудно сказать, как вы можете получить то, что хотите, без воспроизводимого примера. Тем не менее, если вы использовали аргументы xtest= и ytest= при вызове randomForest (при условии, что вы используете пакет «randomforest»), то то, что вы ищете, должно быть частью результирующего объекта randomForest. То, что вы хотите посмотреть, - это test часть полученного случайного списка леса.

Покушение примера:

rf.results <- randomForest(whatever arguments) 
rf.results$test$mse # mse (maybe you can take the square root to get rmse) 
rf.results$test$rsq # pseudo-R2 for random forest 

Если у вас есть пакет случайных лесов загружены вы можете проверить эту информацию, а также сделать некоторые исследования себя ?randomForest. Раздел «Значение» в документации детализирует объект, который возникает при вызове randomForest, и где вы можете найти различные показатели эффективности.

+0

Спасибо, но еще два вопроса: 1: с rf.results $ mse, могу ли я рассчитать mse и rsq набора тренировок? и второй вопрос, почему я получил вектор в качестве результатов !!!? на самом деле, мне нужно только одно реальное значение mse и rsq. но он дает мне один mse и один rsq для каждого образца данных, я думаю. что мне делать? –

+0

'rf.results $ mse' даст вам mse учебного набора, а' rf.results $ rsq' даст псевдо-R2 для набора тренировок. Тест mse и rsq из rf.results $ - это показатели производительности в наборе валидации. Вы должны использовать их, чтобы найти оптимальное количество деревьев в лесу. Причина, по которой вы получаете вектор результатов, объясняется аргументом 'ntree'. Вы получаете показатели эффективности для случайных лесов, состоящих из 1 деревьев 'ntree'. –