Я отлаживаю код с помощью пакета Random Forest, практически без предыдущего опыта R.R - Случайный лес - Удалить Новые уровни факторов, не присутствующие в данных обучения
Я достиг точки, где, excecuting predict.randomForest
, я получаю ошибку:
New factor levels not present in the training data.
Searching этот сайт я нашел причину и понял, что мне нужно, чтобы удалить записи, которые вызывают проблемы ,
Как я могу выделить (выяснить), какие столбцы/строки вызывают проблемы?
Start, проверяя, какие столбцы в матрице предикторов являются факторами. Вы можете запустить 'str (X)', где 'X' является матрицей предикторов в ваших данных обучения. Затем сделайте то же самое в своих тестовых данных и посмотрите на выходе, чтобы увидеть, какие из них имеют разные числа или уровни уровней. – ulfelder
Спасибо! У объекта RF есть много вещей на нем ... какая из них - матрица предикторов, о которой вы говорите? И как я могу проверить, является ли каждый столбец фактором? – DaroK