Я использую xgboost
для проблемы классификации. У меня есть фундаментальный вопрос. Ниже вы можете найти AUC для каждого раунда для поезда и тест (невидимый). Как вы можете видеть, AUC для тестового набора близок к 0. Не могли бы вы помочь мне понять, что происходит?Возможно ли иметь область под кривой = 0?
Я использую python. при необходимости я могу отправить код и данные. Благодаря
[0] test-auc:0.4375 train-auc:0.881865
[1] test-auc:0.25 train-auc:0.947957
[2] test-auc:0.166667 train-auc:0.982759
[3] test-auc:0.166667 train-auc:0.984674
[4] test-auc:0 train-auc:0.996169
[5] test-auc:0 train-auc:0.998723
[6] test-auc:0 train-auc:0.998723
[7] test-auc:0 train-auc:0.999361
[8] test-auc:0.041667 train-auc:1
[9] test-auc:0.041667 train-auc:1
[10] test-auc:0.041667 train-auc:1
[11] test-auc:0.041667 train-auc:1
[12] test-auc:0 train-auc:1
[13] test-auc:0 train-auc:1
Спасибо за ответ. Второй вариант (неправильный класс) вряд ли ... Я дважды проверял. Что касается первого варианта это мое распределения класса ... Поезда распределение меток: {0: 54, 1: 29} Теста распределения меток: {0: 6, 1: 4} – gabboshow
Я Произнесите набор данных совсем невелик. Легко ошибочно предсказать, что 4 из 4 делают AUC '0' –
OK эти результаты были для 1 из 10 краев проверки перекрестка ... Я постараюсь установить k = 3 ... – gabboshow