Есть ли способ ввести «неизвестную» категорию в случайном лесу или сделать двоичную классификацию?Двоичная классификация или неизвестный класс в случайном лесу в R
Я хотел бы подать данные в случайный лес, который я бы хотел только классифицировать, если процент голосов составляет более 70%. У меня всего 6 категорий, поэтому я сначала создал один случайный лес, а значения отсечения автоматически по умолчанию равны c(16.6, 16.6, 16.6, 16.6, 16.6, 16.6)
. Это довольно низкое, так что вместо этого, я хотел бы либо:
- Создать один случайный лес для каждой категории (6 в общей сложности), который использует бинарную классификацию (либо он относится к категории или нет - так его неизвестно), затем подают неизвестные данные в следующее дерево и так далее.
- Или я хотел бы иметь возможность придерживаться одного случайного леса, но вводить новые значения отсечения, которые позволяют мне указать, что класс «выигрыш» должен иметь долю голосов более 70%, а любой данные, которые не обозначены как «неизвестные».
Второй способ в настоящее время представляет собой проблему, как отрезанные значения необходимо подвести к 1, а первое предложение является проблемой, поскольку я не могу показаться, чтобы выяснить, как сделать бинарную классификацию R.
Есть ли в любом случае, что любой из них можно преодолеть, и ввести «неизвестную» категорию? Спасибо