Используя простой пример набора данных «iris», с «trainData» для обучения модели Random Forest и «testData» для прогнозирования/классификации видов.Случайный лес: код R для идентификации конкретных правильно предсказанных записей
# 1 - Create a Random Forest Model.
iris.rf <- randomForest(Species ~ ., data=trainData)
# 2 - Predict using Model and Test data set
iris.pred <- predict(iris.rf, testData)
# 3 - Show Crosstab results:
table(observed = testData$Species, predicted = iris.pred)
Вопрос:
Шаг № 3 выше,
дает таблицу с общим числом
тестовых записей, классифицированных правильно и неправильно.
Что такое код R, чтобы получить список конкретных записей в «Testdata»,
, которые были:
(а) предсказал правильно -или-
(б)НЕ предсказано правильно,
(т. Е. Предсказанные $ Speces ошибочны).
Причина моего вопроса:
Я пытаюсь выяснить
если есть ценная информация
, глядя на конкретных, отдельных записей
, которые были неправильно классифицированных в случайном Лесная сессия.
Может быть, это является дополнительным (возможно) способом
повышения точности
предсказания Random Forest ...
Возможно, я здесь глуп, но у вас есть «истинный позитив» с проблемой классификации, которая не является бинарной? – Jason