Я решаю проблему классификации. Я тренирую свою неконтролируемую нейронную сеть для набора объектов (используя архитектуру skip-gram).Оценка эффективности вложений нейронной сети в классификаторе kNN
Путь я оцениваю это поиск K ближайших соседей для каждой точки данных проверки, из обучающих данных. Я беру взвешенную сумму (веса на основе расстояния) ярлыков ближайших соседей и использую эту оценку каждой точки данных валидации.
Наблюдение - Как я увеличить число эпох (model1
- 600 эпох, model 2
- 1400 эпох и model 3
- 2000) эпоха, моя АУК улучшается при меньших значениях k
но насыщается при аналогичных значениях.
Какое может быть возможное объяснение этого поведения?
[Reposted из CrossValidated]
Я пытаюсь классифицировать отзывы клиентов в двух категориях. Вложения обучаются с использованием предложения2vec. Я написал собственный kNN-классификатор для hadoop. – kampta
Может ли быть так, что между этими двумя классами нет разницы? Например, если это был какой-то анализ настроений, мы часто сталкиваемся с двойными отрицательными выражениями, которые могут нарушить наивный классификатор. –
Если 'model3' лучше классифицирует такие случаи, не лучше ли AUC, чем' model1'? – kampta