Я работаю над многоклассовой моделью с огромным количеством классов (около 3500). Может ли большое количество классов повлиять на производительность моей модели? Я бы хотел использовать SVM и Random Forest. Кто-нибудь знает, есть ли какое-либо ограничение количества классов для этих методов? Заранее спасибоБольшое количество классов
3
A
ответ
2
Да, это может быть связано с производительностью, потому что большинство библиотек решают проблему многоклассов, используя комбинацию двоичных проблем. Существуют разные стратегии (один-vs-all, one-vs-one, winner-take-all и т. Д.), И вы должны попробовать и посмотреть, какие из них достаточно эффективны для вас (при условии, что у вас есть контроль над стратегией).
https://en.wikipedia.org/wiki/Support_vector_machine#Multiclass_SVM
грязный хак, который иногда работал для меня в прошлом, думать о проблеме, как регрессионной задачи вместо мультиклассируют проблемы, но это не может быть действительным в вашем случае, я бы чтобы подробно рассказать о проблеме.
Родной РФ выполняет многоцветный колодец. Тем не менее, обучение любой модели (модельной линии), чтобы распознать 3500 различных классов, серьезно тяжело работает, если почти не будет шума. Конкурирующие кластеры ваших классов и предсказывают их. –