0

Я тестирую алгоритм Birch clustering, реализованный в Scikit Learn. Я немного запутался в заявлении в руководстве; относительно параметра n_clusters, он утверждаетПонимание настроек березовой кластеризации в Scikit Learn

n_clusters : int, instance of sklearn.cluster model, default None 

С другой стороны, начальное описание алгоритма выглядит следующим образом:

класса sklearn.cluster.Birch (порог = 0,5, branching_factor = 50, n_clusters = 3, compute_labels = True, копия = True)

Я бы, что означает, что n_clusters по умолчанию установлен в , а не Отсутствует. Это то, что, похоже, делает, когда я запускаю его.

Я неправильно читаю это? Какова логика этого?

(я предполагаю, что это не помогает, что я не 100% уверен, что на самом деле делает этот параметр, я понял, чтобы применить вид дополнительной тонкой кластеризации к результату методы Birch.)

Любых помощь очень ценится!

+0

Oh noes! Ошибка в документации !!! Мы обречены, мы должны спросить случайные сайты в interwebz о том, что делать сейчас! Мой компьютер сейчас взорвется. –

ответ

0

Да, вы правы. Значение по умолчанию должно быть 3 вместо None.

Когда n_clusters = integer модель подходит становится Agglomerative Clustering чей n_clusters устанавливается на значение этого integer.

Когда n_clusters = None, дальнейший этап кластеризации не выполняется, а подкластеры возвращаются так, как они были раньше.

See #6635 github issue

+1

спасибо! Рад, что это был не просто я, тупой ... – patrick