2013-04-20 5 views
0

Я нашел ссылку о полиномиальном наивного байесовского классификатореРасчет B и | V | в наивном байесе классификации текстов

multinomial naive bayes link

Как мы можем вычислить B' или |V|?

На этой странице указано, что это число терминов в словаре. В его примере, как мы могли получить 6 для B? Это подсчет всего термина?

"китайский", "Пекин", "шанхай", "meacao", "Токио", "Япония"

еще один вопрос, что если новый термин появляется в тестировании документа? Например, в doc 6 появляется «бангкок» или любое новое слово, которое никогда не появлялось раньше. как считать вероятность нового термина?

ответ

1

Вы правы. Это общее количество слов в словаре, поскольку в словаре может быть только одна запись.

+0

спасибо, я просто хочу убедиться. :) – mhabibi

+0

Еще один вопрос: что, если новый термин появится в тестовом документе? Например, в doc 6 появляется «bangkok» или любое новое слово, которое никогда не появляется раньше. как считать вероятность нового термина? спасибо страсти :) – mhabibi