2012-03-21 11 views
0

Скажите, что я сгруппировал набор учебных материалов из 5 классов, содержащих 1000 экземпляров, до 5 кластеров (центров), используя, например, k-средства. Затем я построил матрицу путаницы, выполнив проверку на тестовом наборе данных. Я хочу, чтобы затем использовать график ROC из этого, как это можно сделать?Кривая ROC из результата классификации или кластеризации

ответ

2

Roc Curves показывают компромисс между True Positive и False Positive Rate. Другими словами

ROC графики двумерные графики, в которых скорость ТР Построенные на ось Y и FP скорости откладывается по оси X ROC Graphs: Notes and Practical Considerations for Researchers

При использовании дискретного классификатор , этот классификатор создает только одну точку в пространстве ROC. Обычно вам нужен классификатор, который генерирует вероятности. Вы изменяете свои параметры в классификаторе, чтобы ваши ставки TP и FP менялись. После этого вы используете эти точки для рисования кривой ROC.

Допустим, вы используете k-средства. K-средства дают вам кластерное членство дискретно. Точка принадлежит ClusterA или .. ClusterE. Поэтому вывод кривой ROC из k-средств не является прямым. Lee and Fujita описывает алгоритм для этого. Вы должны посмотреть на свою газету. Но алгоритм - это что-то вроде этого.

  1. Применить к-значит
  2. CALCulate TP и FP с использованием тестовых данных.
  3. изменение членства в точках данных от одного кластера до второго кластера.
  4. рассчитывать TP и FP снова с использованием тестовых данных.

Как вы видите, что они получают больше очков в ROC пространстве и использовать эти точки, чтобы нарисовать кривую ROC

+0

Как вы «членство изменения точек данных из одного кластера ко второму кластеру»? Вы выбираете случайное распределение случайным образом и назначаете его случайному кластеру или как вы это делаете? – shn

+0

Согласно статье, они выбирают точку, когда ее членство в кластере смещается, k означает, что общая целевая функция не изменяется так сильно. –