Итак, у меня есть два разных набора функций A и B. Я пытаюсь определить, какой набор функций является лучшим. Я использую проверку остаточного перекрестного валидации как конечную метрику, так как мой набор данных невелик. Я пытаюсь выяснить мою экспериментальную установку, и я решаю между несколькими способами:Машинное обучение Как сравнить различные наборы функций
1) Дайте набор функций A моему классу (и, возможно, запустите его выбор), и дайте набор функций B тому же классификатор (также необязательно выполнить выбор функции), а затем сравнить ошибку LOOCV между этими двумя классификаторами?
2) Предоставьте набор функций A AND B классификатору, а затем определенно запустите его выбор, а затем выполните вывод более высокого уровня на основе выбранных функций. (Например, если больше от А выбраны состояний, которые показывают множество А, как представляется, провести более прогностическое значение)
3) Некоторые другие пути, которые я не знаю
Я бы использовал 10-кратное, но у меня дисбаланс класса. Поэтому я ожидал бы, что у вас может быть сводка, в которой не будет ни одного определенного класса, и я не смог бы обучить бинарный классификатор. Будет ли обучение чему-то вроде генеративной модели в классе мажоритов, а затем требуется определенный порог P (x | C) (x - это функции, C - класс) - альтернативный подход к проблеме дисбаланса класса? – ABC