ответ

5

Apache Mahout обеспечивает алгоритмы кластеризации.

+0

спасибо. это может быть полезно, но я ищу что-то конкретное для кластеризации терминов. –

1

Оформить заказ NLTK. Существует ряд модулей clustering, которые могут сработать для вас.

1

WEKA имеет целый набор инструментов для обработки текста и кластеризации.

0

Если у вас на Python есть NLTK, как уже упоминалось автором, но есть также sklearn, который обеспечивает гораздо больше, чем просто кластеризацию. (Link перенесет вас в текстовые примеры).

0

Python Scikit learn имеет несколько выделенных пакетов для text analysis. Кроме того, они имеют полный набор алгоритмов кластеризации, который включает в себя алгоритмы (K-means, AP, Mean shift, Spectral Clustering, Hierarchical Clustering и DBSCAN (с соответствующими evaluation metrics). Это может быть полезно для вашей задачи кластеризации.

Ссылка на Scikit Learn latest video tutorial

Ссылка на Scikit Learn Book