Я хочу выбрать лучшее подмножество функций, которое выделяет два класса для подачи в статистическую структуру, которую я создал, где функции не являются независимыми.Выбор наилучшего подмножества функций
После изучения методов выбора функций при обучении машинам кажется, что он попадает в три разные категории: фильтр, обертка и встроенные методы. и методы фильтрации могут быть либо одномерными, либо многомерными. Имеет смысл использовать либо фильтр (многомерный), либо метод обёртки, потому что оба - как я понял - ищут наилучшее подмножество, однако, поскольку я не использую классификатор, как его использовать?
Имеет ли смысл применять такие методы (например, рекурсивная функция отборочных) в DT или Random Forest классификатором где функции имеют правил есть, а затем взять получившееся наилучшее подмножество и кормил в мои рамки ? **
Кроме того, так как большинство из алгоритмов, предоставляемых Scikit учиться являются одномерными алгоритмами, есть ли какие-либо другие библиотеки , которые обеспечивают более алгоритмы выбора функции подмножества питона на основе?
Большого спасибо, это действительно полезно ... так это значит, что я могу на самом деле используйте классификатор для определения важных функций на шаге выбора функций, а затем используйте эту важную функцию для подачи в другую структуру (а не тот же классификатор, который используется на шаге выбора функции)? – Ophilia
Я не понимаю, почему нет. Классификаторы все о дразнить, как X-данные могут использоваться для дремания желаемого выходного сигнала в данных y. Все они должны найти, какая информация на самом деле информативна (против шума) на каком-то уровне. Может быть, классификаторы могут не согласиться с тем, что важно в сигнале, но как шаг выбора функции это должно быть хорошо. – Erotemic
Спасибо большое! Это было очень полезно – Ophilia