Я пишу наивный классификатор заливов для проекта класса, и я просто получил его работу ... вроде. Пока я получаю безошибочный выход, выигрышная метка вывода имела выходную вероятность 3,89 * 10^-85.Классификатор Naive Bays: слишком низкий процент производства
Ничего себе.
У меня есть пара идей о том, что я могу делать неправильно. Во-первых, я не нормализую количество выходных процентов для классов, поэтому все проценты фактически равны нулю. Хотя это даст мне номера, которые выглядят красиво, я не знаю, правильно ли это делать.
Моей второй идеей было уменьшить количество функций. Наши входные данные представляют собой список псевдо-изображений в виде очень длинного текстового файла. В настоящее время наши функции - это всего лишь двоичное значение каждого пикселя изображения, а с изображением 28x28 - множество функций. Если бы я вместо этого расколол изображение на блоки размером, скажем, 7x7, сколько бы это реально улучшило выходные проценты?
Т.Л., др Вот общие вещи, которые я пытаюсь понять, о наивном Байесе:
1), необходимо нормализовать выходные процентов от тестирования каждого класса делать?
2) Сколько эффекта имеет слишком много функций на результатах?
Заранее благодарим за любую помощь, которую вы можете мне дать.
Я одобрил, но что вы подразумеваете под «реальной вероятностью»? –
Это не реальная вероятность класса, учитывая особенности и предшествующие. Это значение имеет значение только при сортировке результатов. В различных упрощениях и предположениях, сделанных большинством реализаций, значение «вероятность» теряется, и это нормально, поскольку это классификатор, и мы хотим найти лучший класс. –
Тем не менее, если вы хотите иметь более читаемые ценности, вы можете их нормализовать (разделите каждый балл на сумму всех оценок класса). –