Я работаю со случайным лесом, и я хотел бы знать, как работает функция выбора. У меня есть набор из 423 функций, и я понимаю, что они выбираются случайным образом с использованием log2 (F) + 1. Таким образом, я получаю подмножество функций 12/13. Но я не могу понять, насколько случайным является выбор, и если эти подмножества должны быть разными для каждого дерева или если подмножество одинаково для всех деревьев, но то, что отличается от нескольких комбинаций. Если у меня есть модель с 10 деревьями, выбор функции должен отличаться от дерева к дереву? Спасибо за вашу помощь.Сколько функций выбирает алгоритм RandomForest?
0
A
ответ
0
Каждое дерево в лесу получает различный случайный образец функций. Обучение дерева решений обычно детерминировано, поэтому, если каждое дерево имеет один и тот же набор функций, все они будут изучать одно и то же дерево решений, которое победит цель. Вы хотите, чтобы все они обучались на разных подмножествах функций.
Если алгоритм выбирает подмножество из 12 функций из исходного набора из 423 объектов, то каждое дерево получит свой собственный образец (без замены) из 12 функций из полного набора.
Возможно, вам стоит проверить этот тезис: http://www.montefiore.ulg.ac.be/~glouppe/pdf/phd-thesis.pdf – tumbleweed