(ранее размещен here, с неправильной подпиской, с недостаточной информацией, которая была закрыта, я редактировал, редактирование, похоже, было удалено, & сообщение отправлено в чистилище , поэтому извинения за повторную публикацию, я не знаю, может ли/должен быть воскрешен предыдущий пост)(R) Графические диаграммы BRT от gbm.step
В R, я запустить некоторые форсированную регрессию дерева, иначе Обобщенные Повышая Модели, используя dismo
, который использует gbm
. Воспроизводимый пример, чтобы заставить человек, где я нахожусь в данный момент:
library(dismo); data(Anguilla_train)
angaus.tc5.lr01 <- gbm.step(data=Anguilla_train, gbm.x = 3:13, gbm.y = 2, family = "bernoulli", tree.complexity = 5, learning.rate = 0.01, bag.fraction = 0.5)
(От here). Это оставляет вам объект модели gbm «angaus.tc5.lr01». Я хотел бы генерировать дендрограммы расщеплений (сгибов?), Т. Е. Строить деревья в соответствии с De'ath 2007 (см. Рис., Левая панель). НО: график Де'ата имеет одно дерево регрессии, а не усиленное дерево регрессии, которое является средним из потенциально тысяч деревьев, каждый из которых работает с другим набором данных, случайным образом вычисленным из набора данных.
Пользователь ckluss любезно предложил rpart, однако, что нуждается в модели, чтобы быть порожденной rpart
так не работает для чернышей/GBMs производства gbm.step
. То же самое относится к prp
от rpart.plot
.
pretty.gbm.tree
в gbm
извлекает матрицу информации для любого выбранного дерева (попробуйте pretty.gbm.tree(angaus.tc5.lr01, i.tree=1)
для первого), поэтому мне интересно, может ли это быть правдоподобным путем к успеху? Например. написав некоторый скрипт, который создает усредненную древовидную матрицу, используя все доступные деревья, а затем преобразует ее в древовидный объект, возможно используя некоторые из методов here.
Люди задавали разные вопросы, казалось бы, без успеха в другом месте в сети. Модели BRT регулярно описываются как «черные ящики», поэтому, возможно, общее мнение заключается в том, что не нужно/быть в состоянии/не пытаться исследовать их и демонстрировать свои внутренние процессы.
Если кто-то знает достаточно о BRTs/gbm
и имеет любые идеи, они были бы с благодарностью приняты. Спасибо.
Проблема в том, что нет «среднего» дерева, так же как нет среднего дерева для randomForest. Например, что, если первый узел разветвляется на числовую переменную половину времени и категориальную переменную в другой половине? что, если некоторые категориальные ветви находятся на домене {A, B, C} и других {C, D, E}? Это просто невозможно. – Chris