1

Помимо PCA или представления данных путем проецирования на два компьютера и получения графика в двухмерном пространстве, каковы другие методы, которые могут дать указание на дискриминацию данных?Каковы индикаторы или метрики разделения данных в классификации, за исключением визуализации данных?

ответ

0

Если у вас есть только два занятия в вашей классификации задачи вы можете использовать:

1. ROC/ППК/Джини: они могли бы представить вам в понятной форме, является ли оценка от вашего классификатором хорошо на отделение ваши классы.

2. ANN: ВИЗУАЛИЗАЦИЯ ПОСЛЕДНЕГО СЛОЯ: Вы можете использовать какой-то способ визуализации данных на выходах последнего уровня вашей сети. Если классы хорошо разделены, вы можете ожидать хорошей дискриминации между ними.

Это методы, которые я обычно использую. Для многоклассовой задачи второй метод остается прежним. В первом вы можете использовать первый против Rest, второй против отдыха и т.д.

UPDATE: Я настоятельно рекомендую вам использовать другие методы снижения визуализации/мерности как T-СНЭ или ISOMAPS. Вы можете прочитать подробное объяснение этих методов here.