2014-01-06 3 views
0

Я использую Random Forests для прогнозирования данных и хотел бы постоянно обновлять обученную модель, используя только новые данные, а не периодически переучивать модель по всем историческим данным. Мне кажется, что РФ не может быть обновляемым, но?Обновляемые случайные леса

Я использую Weka's RF, но любое теоретическое решение или опыт на другом решении может оказать большую помощь. Спасибо

ответ

0

У Weka's RF действительно нет возможности для динамического переобучения, но есть и другие алгоритмы (варианты оригинальной RF), которые имеют эту опцию. Это один из примеров: http://www.ymer.org/amir/software/online-random-forests/

+0

благодарит за ваш ответ. – doxav

+0

Вы уже пробовали онлайн-радио от Амира? Как вы это сравниваете с weka off-line RF с точки зрения эффективности классификации? – doxav

+0

@ doxav вы пробовали это? В моем случае у меня около 1,4 миллиона экземпляров (строки данных) и 57 функций в csv-файле. Вы проверили этот онлайн-случайный лес лично и оценили производительность? Я использовал случайный лес из weka, выпустил модель для fold 1 (из 10-кратной перекрестной проверки), которая заняла около 7,1 часа. Поэтому я очень заинтересован в том, чтобы портировать это на java и быстро для тестирования (интересно, улучшена ли производительность). –