2017-01-01 5 views
0

У меня есть две разреженные матрицы Scipy, title and paragraph, размеры которых (284,183) и (284,4195) соответственно. Каждая строка обеих матриц - это функции из одного экземпляра моего набора данных. Я хочу сгруппировать их без предопределенного количества кластеров, а затем построить их.Кластерные две функции в Python

У меня также есть массив, Y, который относится к каждой строке. (284,1). Один класс представлен 0, другой - 1. Я хотел бы покрасить точки, используя это. Как я могу это сделать с помощью Python?

ответ

0

Для кластеризации вы можете использовать библиотеки распространения аффинности skikit-learn или Mean-shift. Эти алгоритмы выдадут несколько кластеров и центров. Использовать Y представляется другим вопросом, потому что вы не можете построить многомерную точку на 3D-плоскости, если вы не импортируете некоторые другие библиотеки.

+0

Прошу прокомментировать, если это не то, что вы не хотите, потому что я не могу прокомментировать ваш пост, потому что у него недостаточно репутации. – MSPO

+0

Tesnorflow - одна хорошая библиотека для визуализации многомерных точек. Или вы можете использовать дендрограмму на среднем расстоянии точек. – MSPO

+0

Y - это просто два класса, представленные 1 или 0. ie. если 1, цвет синий, если 0 цвет красный. – user7347576

 Смежные вопросы

  • Нет связанных вопросов^_^