Алгоритм сокращения неконтролируемой размерности принимает в качестве входной матрицы NxC1, где N - количество входных векторов, а C1 - количество компонент для каждого вектора (размерность вектора). В результате он возвращает новую матрицу NxC2 (C2 < C1), где каждый вектор имеет меньшее количество компонентов.Нечеткая кластеризация с использованием неконтролируемого уменьшения размерности
Алгоритм нечеткой кластеризации принимает на входе матрицу N * C1, где N, здесь также число входных векторов, а C1 - количество компонентов для каждого вектора. В результате он возвращает новую матрицу NxC2 (C2, обычно меньшую, чем C1), где каждая компонента каждого вектора указывает степень, в которой этот вектор принадлежит соответствующему кластеру.
Я заметил, что ввод и вывод обоих классов алгоритмов в структуре одинаковы, изменяется только интерпретация результатов. Кроме того, там нет нечеткой кластеризации реализации в scikit-не учиться, поэтому следующий вопрос:
Имеет ли смысл использовать сокращение алгоритм размерности для выполнения нечеткой кластеризации? Например, не имеет смысла применять FeatureAgglomeration или TruncatedSVD к набору данных, построенному из векторов TF-IDF, извлеченному из текстовых данных, и интерпретировать результаты как нечеткую кластеризацию?