У меня есть 6-мерный учебный набор данных, где есть идеальный числовой атрибут, который разделяет все примеры обучения таким образом: если TIME < 200, то пример принадлежит классу 1, если TIME> = 200, то пример принадлежит классу2. J48 создает дерево только с 1 уровнем, и этот атрибут является единственным узлом.Рассматривается ли это правило дерева решений с идеальным атрибутом?
Однако тестовый набор данных не следует этой гипотезе, и все примеры пропускаются. У меня возникли проблемы с выяснением того, считается ли это дело чрезмерным или нет. Я бы сказал, что это не так, как набор данных настолько прост, но, насколько я понял определение наложения, это подразумевает высокий уровень подготовки к данным обучения, и это я, что у меня есть. Любая помощь?
Существуют ли другие классы помимо class1 и class2? – user3386109
Нет, только два класса. – vandermies
Тогда зачем вам больше информации, чтобы классифицировать примеры? Другими словами, данные обучения ошибочны, потому что вы * не нуждаетесь в дополнительной информации для классификации примеров. – user3386109