Может ли кто-нибудь указать разницу между выбором функций и алгоритмами сокращения кластеризации и размерности?Разница между выбором функции, кластеризацией, алгоритмом уменьшения размерности
алгоритмы выбора функции: позволяет найти доминирующие переменные либо которые наилучшим образом представляют данные или лучшие параметры, чтобы указать класс для например: GBM/лассо
кластеризация позволяет нам указать, какие кластеры переменных четко определить выход
Разве это не так, как алгоритм сокращения размерности? Не включает в себя выбор + кластеризация так же, как алгоритмы сокращения размерности?
Просто, чтобы убедиться, что я понимаю, что вы сказали, я цитирую пример; Incase У меня есть данные с 1000 входными переменными, а также несколько (~ 5) выходных переменных. У меня также есть 100 значений как входной, так и выходной переменных, и я хочу найти, какая из этих 1000 входных переменных лучше всего влияет на выходные переменные. В этой проблеме я не только хочу найти лучшее подмножество входных переменных, которые представляют максимальную вариацию моих данных, но и найти, какие переменные сильно влияют на мои выходные параметры. Будет ли это проблемой выбора функции или проблемой уменьшения размерности? –
Если вы хотите узнать, какие функции наиболее ценны для вас, вы должны сделать выбор функции (проверьте mRMR). Если вы используете только эти функции в своем алгоритме, а это означает, что вы также уменьшили размерность. Поскольку вы выбрали подмножество функций (размеров) и уменьшили размер. – kamaci