Я изучаю случайные леса с некоторыми данными, которые я собрал. Я тестировал свой классификатор и получал точность около 89% на моем тестовом наборе. Однако, когда я масштабировал свои данные до нулевой средней и удельной дисперсии, моя точность снизилась почти на 50%. Я наткнулся на сообщение this, которое, похоже, предполагает, что мне не нужно масштабировать данные, чтобы получить оптимальную производительность.Нормализация ухудшает производительность классификатора
Может ли кто-нибудь пролить свет на возможные причины столь значительного падения точности?
Edit: Я использую sklearn.ensemble
для моего случайного леса implemententation
Вот link на данные
Это данные. Можете ли вы поделиться своими данными где-нибудь? – greeness
@greeness Я загрузил свой файл данных – Ajit