Я реализовал классификатор KNN в java и получил странный результат. Если я сделаю анализ настроений на примере набора данных Amazon, то я получил точность 55%. Из 100 тестовых документов 55 правильно классифицируются как отрицательные или положительные отзывы и 45 неверно. Но если я использую KNN для примера категории камеры или книг, то я получил точность 95%.Анализ чувствительности классификатора KNN и точность анализа категории
Есть некоторые объяснения, что мой код является неправильным? Есть идеи?
Яблоки в апельсинах? Вы сравниваете эффективность KNN при анализе настроений и производительности KNN по категоризации? Вы бы использовали радикально разные функции в этих случаях .... это не ошибка алгоритма, если они плохо работают ... – Crisfole
@ Кристофер Пфохл, да, я сравниваю эффективность KNN в анализе категоризации и настроения. Что вы имеете в виду радикально разные функции? Я использовал словосочетание и стоп-слова. – flatronka
спасибо @gary, но мне нужна только теория, мой код - это более 15 классов, интерфейсов, мне нужна теория, что это возможно или нет. – flatronka