0

Я работаю над пилотом с обслуживанием Amazon Web Service Machine Learning, и у меня есть некоторые сомнения.Как интерпретировать результаты работы службы машинного обучения AWS?

Я использовал модель бинарного классификатора и, на мой взгляд, гистограмма полученных результатов не соответствует числовым результатам. Согласно гистограмме, распределение False Positives выше, чем распределение True Negatives, но численные результаты этого поведения не проявляют.

Histogram

  • 778 истинных позитивов
  • 15,178 истинные негативы
  • 6,663 ложных срабатываний
  • 173 Ложноотрицательные

Любой человек может принести некоторые идеи в этом вопросе?

Спасибо,

ответ

0

Это ответ на мой вопрос от команды Amazon Web Services поддержки через свои форумы:

После выполнения некоторых копаться, я обнаружил, что масштабирование Y-ось логарифмические для гистограмм, что объясняет, почему прямая 1: 1 область сравнение истинных отрицательных и ложных срабатываний не будет в соответствии с численными результатами. Если мы не отобразили логарифмической шкалы, я предполагаю, что большая часть вашей оси Y будет , где доминируют истинные отрицательные и истинные положительные результаты, а ложные положительные и ложные негативы могут быть слишком маленькими, чтобы заметно увидеть.

Ссылка: https://forums.aws.amazon.com/message.jspa?messageID=733706

Если Y-ось логарифмическая результаты не совпадают с предусмотренными гистограмм.

0

Вы контролируете на отсечной счет (вертикальная линия), и вы можете переместить его справа налево и наоборот. На вашей диаграмме вы переместили показатель отсечки влево, что означает, что вы в большинстве случаев будете прогнозировать «Да», и поэтому у вас будет много других ложных срабатываний (ошибочно предсказанных как положительные (= Да), чем ложные отрицательные .

+0

Благодарим вас за ваш ответ, но проблема здесь в гистограмме негативов. Как видно из прилагаемого изображения, с учетом порога 0,02 и только гистограммы отрицательных наблюдений площадь, покрытая левым краем порога, значительно меньше площади справа. Это не соответствует полученным результатам: 15,178 истинных негативов (площадь слева от порога) 6,663 ложных срабатываний (область справа от порога) –

+0

Вы не видите всех истинных негативов (серая область в верхней левой части), поскольку у вас, вероятно, много нулей или близких к нулевым значениям. Если вы сравниваете ложные предсказания (ложные отрицания = 173 и ложные срабатывания = 6,663), вы можете легко увидеть соотношение этих полосатых областей влево и вправо от линии отсечения. – Guy

+0

Я не думаю, что имеет смысл не видеть всех истинных негативов. Если много нулей и близких к нулю значений, гистограмма должна иметь очень большое число, и это все ... не так ли? Если шкала вертикальной оси не логарифмическая! –