2016-05-24 6 views
2

Как получить доверительный интервал или меру дисперсии прогнозирования при использовании xgboost для классификации?Как получить доверительный интервал или меру дисперсии прогнозирования при использовании xgboost для классификации?

Так, например, если xgboost прогнозирует вероятность события 0,9, как можно получить уверенность в этой вероятности?

Кроме того, эта уверенность считается гетеросквадической?

ответ

2

Чтобы создать доверительные интервалы для модели xgboost, вы должны обучить несколько моделей (для этого вы можете использовать мешок). Каждая модель будет давать ответ для тестового образца - все ответы будут формировать распределение, из которого вы можете легко вычислить доверительные интервалы, используя базовую статистику. Вы должны подготовить распределение ответов для каждого тестового образца.

+0

Я предлагаю запустить 100 моделей (чем больше, тем лучше) и проверить, в каком диапазоне лежит 95% значений. Ответная переменная является гомоседастической. – pplonski

+0

Среднее и стандартное отклонение прогнозов НЕ совпадает с доверительным интервалом. – michel

+0

Конечно, это среднее значение и std прогнозов - это нечто иное, чем доверительные интервалы - вопрос заключался в том, как вычислить доверительные интервалы, и я дал рецепт для этого – pplonski