У меня около 10 000 образцов и 9 000 функций. Я пытаюсь использовать RandomForest (RF или GRF) для выбора/уменьшения функции (переменной).RandomForest in R с большим количеством функций
Концепция отлично работает, когда я использую 700 функций, но за 9000, когда я пытаюсь запустить randomForest или RRF, даже с 1 деревом (и даже с mtry = 1), я жду часами и ничего не происходит. (FYI, я использую sampsize = 800)
Я надеялся хотя бы на то, чтобы иметь возможность запускать единое дерево, а затем использовать несколько компьютеров и комбинировать.
Любые идеи для оказания помощи?
Рони
Возможно, вы используете неправильный метод уменьшения размерности. Я бы попробовал PCA, он должен быть быстрее. Я считаю, что randomForest - отличная модель для прогнозирования, но медленная. По крайней мере, используя «нормальный» ноутбук. Как только вы уменьшите измерение, попробуйте randomForest. – marbel
Если вы собираетесь придерживаться случайных лесов, есть относительно новый пакет под названием ** wsrf **, который вы, возможно, захотите изучить. Кроме того, ** bigrf ** может стоить внимания. – joran