В документации Спарка официальной,Как работает VectorSlicer в Spark 2.0?
VectorSlicer является трансформатором, который принимает вектор признаков и выводит новый вектор признаков с подрешеткой оригинальных черт. Он полезен для извлечения признаков из векторного столбца.
выбрать ли это важные функции из набора функций?
Если это так, то как это делается без упоминания зависимой переменной?
Я пытаюсь выполнить кластеризацию данных, и мне нужны важные функции, которые улучшат кластеры. Могу ли я использовать VectorSlicer
?
Я проголосовал за ваш ответ, но если вы можете объяснить свой второй пункт по уменьшению размера в выборе значения важности. Я не уверен, что OP получит эту точку (и для другого читателя тоже) – eliasah
@eliasah Отредактировано в соответствии с запросом. – user7337271