Вот удлиненно пример, реальная confuson матрица с 10 входных классов "0" - "9" (рукописные цифры), и 10 выходных кластеров с маркировкой А - J.
Confusion matrix for 5620 optdigits:
True 0 - 9 down, clusters A - J across
-----------------------------------------------------
A B C D E F G H I J
-----------------------------------------------------
0: 2 4 1 546 1
1: 71 249 11 1 6 228 5
2: 13 5 64 1 13 1 460
3: 29 2 507 20 5 9
4: 33 483 4 38 5 3 2
5: 1 1 2 58 3 480 13
6: 2 1 2 294 1 1 257
7: 1 5 1 546 6 7
8: 415 15 2 5 3 12 13 87 2
9: 46 72 2 357 35 1 47 2
----------------------------------------------------
580 383 496 1002 307 670 549 557 810 266 estimates in each cluster
y class sizes: [554 571 557 572 568 558 558 566 554 562]
kmeans cluster sizes: [ 580 383 496 1002 307 670 549 557 810 266]
Например, кластер A имеет 580 точек данных, 415 из которых составляют «8»; В кластере B имеется 383 точки данных, из которых 249 - «1»; и так далее.
Проблема заключается в том, что классы вывода скремблируются, переставляются; они соответствуют в таком порядке, с подсчетов:
A B C D E F G H I J
8 1 4 3 6 7 0 5 2 6
415 249 483 507 294 546 546 480 460 257
Один мог сказать, что "процент успеха" является 75% = (415 + 249 + 483 + 507 + 294 + 546 + 546 + 480 + 460 + 257)/5620
, но это отбрасывает полезную информацию — здесь, что E и J говорят «6», и ни один кластер не говорит «9».
Итак, добавьте самые большие числа в каждом столбце матрицы замешательства и разделите их на общее количество.
Но, как считать перекрывающиеся/отсутствующие кластеры, , как 2 "6", нет "9" здесь?
Не знаю, как обычно согласованно (сомните, что на практике используется Hungarian algorithm ).
Нижняя линия: не выбрасывайте информацию; посмотрите на всю матрицу путаницы.
NB такой «показатель успеха» будет оптимистичным для новых данных!
Обычно принято разделять данные на 2/3 «набор для обучения» и 1/3 «тестовый набор», поезд, например. k-средства только на 2/3,
затем измерять путаницу/коэффициент успеха на тестовом наборе — в целом хуже, чем на тренировочном наборе.
Гораздо больше можно сказать; см., например, Cross-validation.
Я задаю критерии. – MonsterMMORPG