2017-01-31 18 views
1

Я использую xgboost для проблемы классификации. У меня есть фундаментальный вопрос. Ниже вы можете найти AUC для каждого раунда для поезда и тест (невидимый). Как вы можете видеть, AUC для тестового набора близок к 0. Не могли бы вы помочь мне понять, что происходит?Возможно ли иметь область под кривой = 0?

Я использую python. при необходимости я могу отправить код и данные. Благодаря

[0]  test-auc:0.4375 train-auc:0.881865 
[1]  test-auc:0.25 train-auc:0.947957 
[2]  test-auc:0.166667  train-auc:0.982759 
[3]  test-auc:0.166667  train-auc:0.984674 
[4]  test-auc:0  train-auc:0.996169 
[5]  test-auc:0  train-auc:0.998723 
[6]  test-auc:0  train-auc:0.998723 
[7]  test-auc:0  train-auc:0.999361 
[8]  test-auc:0.041667  train-auc:1 
[9]  test-auc:0.041667  train-auc:1 
[10] test-auc:0.041667  train-auc:1 
[11] test-auc:0.041667  train-auc:1 
[12] test-auc:0  train-auc:1 
[13] test-auc:0  train-auc:1 

ответ

2

АУК из 0 означает, что предсказатель предсказывает неправильный класс для всех образцов в тестовом наборе.

Глядя на AUC учебного набора, это означает, что размер вашего тестового набора слишком мал или вы выбрали неправильный (противоположный) класс для построения AUC ваших тестовых прогнозов.

+0

Спасибо за ответ. Второй вариант (неправильный класс) вряд ли ... Я дважды проверял. Что касается первого варианта это мое распределения класса ... Поезда распределение меток: {0: 54, 1: 29} Теста распределения меток: {0: 6, 1: 4} – gabboshow

+0

Я Произнесите набор данных совсем невелик. Легко ошибочно предсказать, что 4 из 4 делают AUC '0' –

+0

OK эти результаты были для 1 из 10 краев проверки перекрестка ... Я постараюсь установить k = 3 ... – gabboshow

 Смежные вопросы

  • Нет связанных вопросов^_^