Я работаю над задачей классификации в Weka и получил проблему, которую мой класс для прогнозирования имеет очень важное значение (около 85%). Это приводит к тому, что многие алгоритмы обучения просто предсказывают эту частую ценность этого класса для нового набора данных.Как бороться с частыми занятиями?
Как я могу справиться с этой проблемой? Означает ли это, что я не нашел функций, которые работают достаточно хорошо, предсказывая что-то лучше? Или есть что-то конкретное, что я могу сделать, чтобы решить эту проблему?
Я думаю, это довольно распространенная проблема, но я не смог найти здесь решение.
Classes! = Особенности. –
Возможный дубликат [Инструменты для многоклассической несбалансированной классификации в статистических пакетах] (http://stackoverflow.com/questions/12877153/tools-for-multiclass-imbalanced-classification-in-statistical-packages), [Как бороться с низкими частотные примеры в классификации?] (http://stackoverflow.com/questions/17618532/how-to-deal-with-low-frequency-examples-in-classification) и несколько других вопросов. –
Большое спасибо за вашу быструю помощь! Эти вопросы дают мне подсказки о том, как назвать эту проблему (и как ее решить). И извините, если я перепутаю условия. Weka использует их по-другому, чем я их изучил в первый раз. – Martin