Я начинаю использовать NaiveBayes/Simple классификатор для классификации (Weka), однако у меня есть некоторые проблемы, которые нужно понимать при обучении данных. Набор данных, который я использую, - weather.nominal.arff.интерпретация результатов Наивного Байеса
В то время как я использую использовать тест обучения из вариантов, результат Классификатор:
Correctly Classified Instances 13 - 92.8571 %
Incorrectly Classified Instances 1 - 7.1429 %
a b classified as
9 0 a =yes
1 4 b = no
Мой первый вопрос, что я должен понять из неправильных классифицированных случаев? Почему возникла такая проблема? какая коллекция атрибутов классифицирована некорректно? есть ли способ понять это?
Во-вторых, когда я пытаюсь проверить 10-кратный крест, почему я получаю разные (менее) правильно классифицированные экземпляры?
Результаты:
Correctly Classified Instances 8 57.1429 %
Incorrectly Classified Instances 6 42.8571 %
a b <-- classified as
7 2 | a = yes
4 1 | b = no
спасибо за ясный ответ и совет weka + 1. смущающая точка предвзятая, что вы имеете в виду? Должен ли я всегда использовать перекрестную проверку для всех моих разных алгоритмов классификации? – berkay
подумайте об этом, вы хотите узнать сеть Naive Bayes, которая моделирует ваши данные, а затем вы хотите проверить ее точность предсказания. Если вы тренируете модель и проверяете ее в одном и том же наборе экземпляров, вы переоцениваете ее точность (они видели, что эти конкретные примеры, таким образом, хорошо работают на них), но, вероятно, будут менее успешными в отношении новых данных. Ключевым моментом здесь является ** обобщение **: мы хотим обобщить за пределами случаев, которые были предоставлены в «время обучения» новым невидимым примерам. – Amro
Amro спасибо за четкие ответы. Я размещаю здесь, чтобы задать вопрос отзыва и точность результатов перекрестной проверки. (7/(2 + 7)) = 0778, а точность равна (1/(1 + 4)) = 0,2, однако weka говорит для точности = 0,636? любая идея об этом? – berkay