При использовании XGBoost
нам нужно преобразовать категориальные переменные в числовые.XGBoost Категориальные переменные: Dummification vs encoding
Будет ли какое-либо различие в метриках производительности/оценке между методами:
- dummifying своим категориальным переменными
- , кодирующим вашим категориальным переменным, например, из (А, б, в) (1,2,3)
ТАКЖЕ:
Будут ли какие-либо причин не идти с методом 2, используя, например, labelencoder
?
Не будет ли это сделать функции с большим количеством категорий кажутся более важными, чем те, с меньше? – eleanora
Как 'Xgboost' знает, как обрабатывать' array ([1., 0., ...]) 'как категориальный, а не числовой? –
@ThiagoBalbo Проще говоря: это не так. Вы просто замените исходную переменную/функцию/столбец на 3 двоичные переменные/функции/столбцы. – masu