Я обучил ExtraTreesClassifier (индекс gini), используя scikit-learn, и это соответствует моим потребностям справедливо. Не такая хорошая точность, но с использованием 10-кратной перекрестной проверки AUC составляет 0,95. Я хотел бы использовать этот классификатор для своей работы. Я совершенно новичок в ML, поэтому, пожалуйста, простите меня, если я прошу вас что-то концептуально неправильно.Как установить пороговое значение для классификатора sklearn на основе результатов ROC?
Я построил некоторые кривые ROC, и благодаря этому, кажется, у меня есть определенный порог, когда мой классификатор начинает хорошо работать. Я хотел бы установить это значение в установленном классификаторе, поэтому каждый раз, когда я вызываю прогноз, классификаторы используют этот порог, и я мог бы поверить в ставки FP и TP.
Я также пришел к этому сообщению (scikit .predict() default threshold), где указано, что порог не является общим понятием для классификаторов. Но так как ExtraTreesClassifier имеет метод pred_proba, а кривая ROC также связана с определением thresdholds, мне кажется, что я должен быть доступен, чтобы указать его.
Я не нашел ни одного параметра, ни какого-либо класса/интерфейса для его использования. Как установить пороговое значение для обученного ExtraTreesClassifier (или любого другого) с помощью scikit-learn?
Большое спасибо, COLIS
Привет Белый, спасибо за Ваш ответ. Я оптимизировал его, выбрав roc_auc и другие показатели, которые были мне интересны в то время (я также создал пользовательский счетчик для оптимизации LR +). Мое главное сомнение заключается в том, как выбрать один из пороговых значений, показанных точкой на кривой ROC, как пороговое значение, когда я вызываю pred()? Мой вопрос связан с (). Я не уверен, что это будет доступно для деревьев, поскольку они обычно не используют probas. Но как установить его для других методов? –
Colis