1

ОбзорЧто касается использования прогнозирования в реализации RandomForest с использованием Ranger

Я классификация документов с использованием случайной реализации лесов в рейнджер Р.

Теперь я столкнулся вопрос, системы ожидает все функций, которые являются в наборе Train, который должен присутствовать в наборе данных в реальном времени, которого невозможно достичь, , следовательно, я не могу предсказать для текста данных в реальном времени.

Процедура следующая

Цель: Предсказать описание принадлежит к какому типу класса (т.е. OutputClass)

Каждый из информации, например, описания, характеристики преобразуются в документ термин матрицы

Срок действия матрицы документов для набора поездов

        rpm  Velocity  Speed   OutputClass 

     doc1       1    0    1   fan 
     doc2       1    1    1   fan 
     doc3       1    0    1   referigirator 
     doc4       1    1    1   washing machine 
     doc5       1    1    1   washing machine 

Теперь поезд модели с использованием вышеуказанной матрицы

fit <- ranger(trainingColumnNames,data=trainset) 
save(fit,file="C:/TrainedObject.rda”) 

Теперь я использую выше хранимый объект предсказать реальное описание времени для своего класса типа.

Load("C:/TrainedObject.rda”) 

Снова постройте матрицу документов для RealTimeData.

          Velocity   Speed  OutputClass 

     doc5          0    1    fan 
     doc6          1    1    fan 
     doc7          0    1   referigirator 
     doc8          1    1   washing machine 
     doc9          1    1   washing machine 

В данных в режиме реального времени нет термина или функции по названию «RPM». Так момент я называю предсказать функцию

Predict(fit, RealTimeData) 

он показывает ошибку говоря RPM отсутствует,

, которые практически невозможно получить все слово или особенность поезда, установленного в данных в режиме реального времени каждый раз.

Я попытался как в реализации случайного леса в R (Ranger, RandomForest) с параметром в функции, как предсказывают NewData Predict.all treetype.

Ни один из параметров не помог предсказать недостающие функции в данных реального времени.

кто-то пожалуйста, помогите мне, как решить данный вопрос

Заранее спасибо

+0

Я не думаю, что это проблема с Random Forest, я уверен, что это проблема для всех (или почти всех) алгоритмов.Одним из вариантов было бы обучение модели каждый раз с помощью функций, которые у вас есть в данных в реальном времени. Другим было бы добавить недостающие функции и заполнить его отсутствующими значениями или средним значением столбца из данных обучения. Есть более сложные решения, но это хорошее место для начала. – Tchotchke

ответ

0

predict ожидает все будущего Вы предоставили Ranger. Следовательно, если у вас отсутствуют данные в тестовом наборе, вы либо удаляете проблемную функцию из набора поездов, либо снова запускаете рейнджера или заполняете отсутствующие значения. Для последнего решения вы можете взглянуть на пакет mice.

 Смежные вопросы

  • Нет связанных вопросов^_^