Я нашел ссылку о полиномиальном наивного байесовского классификатореРасчет B и | V | в наивном байесе классификации текстов
Как мы можем вычислить B'
или |V|
?
На этой странице указано, что это число терминов в словаре. В его примере, как мы могли получить 6
для B
? Это подсчет всего термина?
"китайский", "Пекин", "шанхай", "meacao", "Токио", "Япония"
еще один вопрос, что если новый термин появляется в тестировании документа? Например, в doc 6 появляется «бангкок» или любое новое слово, которое никогда не появлялось раньше. как считать вероятность нового термина?
спасибо, я просто хочу убедиться. :) – mhabibi
Еще один вопрос: что, если новый термин появится в тестовом документе? Например, в doc 6 появляется «bangkok» или любое новое слово, которое никогда не появляется раньше. как считать вероятность нового термина? спасибо страсти :) – mhabibi