Скажите, что я сгруппировал набор учебных материалов из 5 классов, содержащих 1000 экземпляров, до 5 кластеров (центров), используя, например, k-средства. Затем я построил матрицу путаницы, выполнив проверку на тестовом наборе данных. Я хочу, чтобы затем использовать график ROC из этого, как это можно сделать?Кривая ROC из результата классификации или кластеризации
ответ
Roc Curves показывают компромисс между True Positive и False Positive Rate. Другими словами
ROC графики двумерные графики, в которых скорость ТР Построенные на ось Y и FP скорости откладывается по оси X ROC Graphs: Notes and Practical Considerations for Researchers
При использовании дискретного классификатор , этот классификатор создает только одну точку в пространстве ROC. Обычно вам нужен классификатор, который генерирует вероятности. Вы изменяете свои параметры в классификаторе, чтобы ваши ставки TP и FP менялись. После этого вы используете эти точки для рисования кривой ROC.
Допустим, вы используете k-средства. K-средства дают вам кластерное членство дискретно. Точка принадлежит ClusterA или .. ClusterE. Поэтому вывод кривой ROC из k-средств не является прямым. Lee and Fujita описывает алгоритм для этого. Вы должны посмотреть на свою газету. Но алгоритм - это что-то вроде этого.
- Применить к-значит
- CALCulate TP и FP с использованием тестовых данных.
- изменение членства в точках данных от одного кластера до второго кластера.
- рассчитывать TP и FP снова с использованием тестовых данных.
Как вы видите, что они получают больше очков в ROC пространстве и использовать эти точки, чтобы нарисовать кривую ROC
Как вы «членство изменения точек данных из одного кластера ко второму кластеру»? Вы выбираете случайное распределение случайным образом и назначаете его случайному кластеру или как вы это делаете? – shn
Согласно статье, они выбирают точку, когда ее членство в кластере смещается, k означает, что общая целевая функция не изменяется так сильно. –