ОбзорЧто касается использования прогнозирования в реализации RandomForest с использованием Ranger
Я классификация документов с использованием случайной реализации лесов в рейнджер Р.
Теперь я столкнулся вопрос, системы ожидает все функций, которые являются в наборе Train, который должен присутствовать в наборе данных в реальном времени, которого невозможно достичь, , следовательно, я не могу предсказать для текста данных в реальном времени.
Процедура следующая
Цель: Предсказать описание принадлежит к какому типу класса (т.е. OutputClass)
Каждый из информации, например, описания, характеристики преобразуются в документ термин матрицы
Срок действия матрицы документов для набора поездов
rpm Velocity Speed OutputClass
doc1 1 0 1 fan
doc2 1 1 1 fan
doc3 1 0 1 referigirator
doc4 1 1 1 washing machine
doc5 1 1 1 washing machine
Теперь поезд модели с использованием вышеуказанной матрицы
fit <- ranger(trainingColumnNames,data=trainset)
save(fit,file="C:/TrainedObject.rda”)
Теперь я использую выше хранимый объект предсказать реальное описание времени для своего класса типа.
Load("C:/TrainedObject.rda”)
Снова постройте матрицу документов для RealTimeData.
Velocity Speed OutputClass
doc5 0 1 fan
doc6 1 1 fan
doc7 0 1 referigirator
doc8 1 1 washing machine
doc9 1 1 washing machine
В данных в режиме реального времени нет термина или функции по названию «RPM». Так момент я называю предсказать функцию
Predict(fit, RealTimeData)
он показывает ошибку говоря RPM отсутствует,
, которые практически невозможно получить все слово или особенность поезда, установленного в данных в режиме реального времени каждый раз.
Я попытался как в реализации случайного леса в R (Ranger, RandomForest) с параметром в функции, как предсказывают NewData Predict.all treetype.
Ни один из параметров не помог предсказать недостающие функции в данных реального времени.
кто-то пожалуйста, помогите мне, как решить данный вопрос
Заранее спасибо
Я не думаю, что это проблема с Random Forest, я уверен, что это проблема для всех (или почти всех) алгоритмов.Одним из вариантов было бы обучение модели каждый раз с помощью функций, которые у вас есть в данных в реальном времени. Другим было бы добавить недостающие функции и заполнить его отсутствующими значениями или средним значением столбца из данных обучения. Есть более сложные решения, но это хорошее место для начала. – Tchotchke