Ответ "нет". Чтобы выполнить основное обучение со случайными лесами, вы должны
- Разделите свои данные на партии разумного размера (ограниченные объемом оперативной памяти, чем больше, тем лучше);
- поезд отдельных случайных лесов;
добавить все основные деревья вместе в estimators_
члена одного из деревьев (непроверенных):
for i in xrange(1, len(forests)):
forests[0].estimators_.extend(forests[i].estimators_)`
(Да, это Hacky, но никакого решения этой проблемы не найдено пока Обратите внимание, что с очень большими наборами данных может потребоваться просто образец примеров обучения, которые помещаются в ОЗУ большой машины, а не для обучения на всем этом. Другой вариант - переключиться на линейные модели с SGD, которые реализуют partial_fit
но, очевидно, они ограничены в виде функций, которые они могут изучить.)
Почему бы вам не попробовать это сами? Это не похоже на то, что вы не можете понять самостоятельно. –
@InbarRose, похоже, для меня не так просто. Классический случайный лес не является онлайн-классификатором, поэтому легкий ответ «вы не можете». Есть некоторые подходы к решению этого, но сложные, и я сомневаюсь, что они реализованы в sklearn. – alko
что непонятно по этому вопросу? – alko