2010-05-30 4 views
2

Я пытаюсь понять байесовскую сеть. У меня есть файл данных, который имеет 10 атрибутов, я хочу получить таблицу беспорядка в этой таблице данных, я думал, что мне нужно вычислить tp, fp, fn, tn всех полей. Это правда ? если это то, что мне нужно сделать для байесовской сети.Матрица замешательства Bayesian Network

На самом деле нужно руководствоваться, я потерян.

+0

I У меня проблемы с пониманием вопроса. Какую задачу выполняет ваша байесовская сеть? Это классификация? Если да, то что классифицируется, является ли это одним из атрибутов вашего файла данных? Более подробная информация позволит ответить на этот вопрос. –

ответ

3

Confusion matrix Используется для оценки производительности классификатора, любого классификатора.

4

Процесса обычно выглядит следующим образом:

  • У вас есть несколько меченых экземпляров данных , которые вы хотите использовать для обучения классификатора, так что он может предсказать класс новых немеченых экземпляров.
  • Использования классификатора выбора (нейронные сетей, Байес сети, SVM, и т.д ...) мы строим модели с подготовкой данными в качестве входных данных.
  • На этом этапе вы, как правило, хотели бы оценить производительность модели перед ее развертыванием. Таким образом, используя ранее неиспользуемое подмножество данных (набор тестов), мы сравниваем классификацию модели для этих экземпляров по сравнению с классом фактического класса. A . Хороший способ суммировать эти результаты. - это матрица путаницы, которая показывает , как прогнозируется каждый класс экземпляров .

Для двоичных задач классификации конвенция должна назначать один класс положительным, а другой - отрицательным. Таким образом, из матрицы путаницы процент положительных случаев, которые правильно классифицируются как положительные, известен как показатель True Positive (TP). Другие определения следуют тому же соглашению ...

0

Что вы спрашиваете - это матрица путаницы с более чем двумя классами. Вот шаги, как вы это делаете:

  • построить классификатор для каждого класса, где обучающий набор состоит из набора документов в классе (положительные метки) и его комплемента (отрицательные ярлыки).
  • Учитывая тестовый документ, применяйте каждый классификатор отдельно.
  • Назначает документ в класс с максимальным счетом, максимальным значением доверительного или максимальной вероятностью

Вот ссылка на бумагу вы можете получить более подробную информацию:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT. 

 Смежные вопросы

  • Нет связанных вопросов^_^