Я использую KMeans для извлечения кластеров из набора строк, и я не очень впечатлен результатами, и я хотел попробовать DBSCAN, чтобы узнать, может ли это дать лучшие результаты. Выводит ли DBSCAN кластерные слова как KMeans?DBSCAN Clustering Python - кластерные слова
Я был в состоянии использовать DBSCAN и был способен выводить число кластеров как «3», но я хотел бы знать, какой контекст является движущей силой его, чтобы сделать «3» кластеры (я хотел бы знать слова)
вот мой фрагмент кода
db = DBSCAN(eps=0.3, min_samples=10).fit(X)
core_samples_mask = np.zeros_like(db.labels_, dtype=bool)
core_samples_mask[db.core_sample_indices_] = True
labels = db.labels_
# Number of clusters in labels, ignoring noise if present.
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
print('Estimated number of clusters: %d' % n_clusters_)
print("Silhouette Coefficient: %0.3f"% metrics.silhouette_score(X, labels))