Балансировка между максимальной глубиной и числом оценок или количеством раундов

Это теоретический вопрос для повышения интенсивности xgb и градиента в целом. Как узнать, что является лучшим балансом max_depth и num_rounds или n_estimators. Очевидно, что больше max_depth создает сложные модели, которые не рекомендуется в повышении, но сотни раундов повышения могут также привести к более высокому уровню подготовки данных обучения. Предполагая, что CV дает мне среднее значение/std для max_depth 5 и num_rounds 1000 против max_depth 15 и num_rounds 100 - какой из них следует использовать при выпуске модели для неизвестных данных?Балансировка между максимальной глубиной и числом оценок или количеством раундов

источник

2016-04-27 Run2

Теоретически можно было бы дать оценки обобщений для этих моделей, но проблема в том, что они чрезвычайно свободны. Таким образом, меньшая верхняя граница не гарантирует лучших результатов. На практике лучший подход заключается в том, чтобы сделать вашу оценку обобщения более надежной - вы используете 10-CV? Используйте 10x10 CV (десять случайных перетасовки 10CV), если он все равно не дает ответа, используйте 100. В какой-то момент вы получите победителя. Кроме того, если вы на самом деле собираетесь обновить модель до общественности, возможно, ожидаемое значение не является лучшим показателем? CV обычно сообщает среднее значение (ожидаемое значение) - поэтому вместо того, чтобы смотреть только на это - посмотрите на весь спектр полученных результатов. Два значения с одним и тем же средним значением и разными std ясно показывают, что выбрать. Когда оба средства и stds одинаковы, вы можете посмотреть минимальную оценку (которая будет захватывать сценарий «наихудшего случая») и т. Д.

Подводя итог: внимательно посмотрите на оценки, а не только на средние значения - и повторите несколько раз, чтобы сделать это надежным.

источник

2016-04-27 22:17:20 lejlot

Спасибо. Я отвечу на это как на ответ. Мне было интересно, отслеживать ли ошибки на случайной выборке (может составлять 10% данных) после каждого раунда. Или может случиться так, как после каждого раунда изменяется результат проверки. Скажем, если я (имея крупную раннюю остановку 200 в xgboost, я не знаю, как это сделать в sklearn) нарисуйте количество раундов, после чего уменьшается потеря проверки после каждого снижения, могу ли я твердо сказать, что модель, которая имеет эту строку по всем остальным линиям будет лучше? – Run2

Область под такой кривой не даст вам хорошего селектора, так как в конце вы используете только окончательную модель, неважно, если раньше это было плохо. – lejlot

Привет - Я не думал о площади. Это больше похоже на это - скажем, модель 1 имеет эти значения – Run2

Балансировка между максимальной глубиной и числом оценок или количеством раундов

ответ

Смежные вопросы