3

Что такое данные аргумент для seaborn clustermap.Морская кластерная карта: какой главный аргумент, наблюдения или расстояния?

Требуется ли матрица, где каждая ячейка является расстоянием между векторами исходной матрицы с наблюдениями? Или кластерная карта вычисляет расстояние, так что мне нужно передать матрицу наблюдения?

В первом случае, что аргумент метрический есть для? Следует ли указывать, какая метрика использовалась для расчета расстояний?

+0

Этот раздел [answer] (http://stackoverflow.com/a/38858404/1628638) содержит подробную информацию о расчете расстояния в 'clustermap()'. –

ответ

2

Очевидно - посмотрите на «примеры» на самой странице, на которую вы ссылались - она ​​ожидает таблицу и метрику, используемую для вычисления расстояний.

Как указано в документации кластерной карты, оно использует scipy.spatial.distance.pdist для вычисления попарных расстояний.

Я не вижу возможности использовать предварительно вычисленную матрицу расстояний, хотя может быть возможно передать пользовательскую функцию, которая могла бы выполнять поиск по матрице.

+0

Тогда есть что-то, чего я не понимаю, почему в примере, когда кластер извлекается при вычислении косинусной метрики, мы имеем шкалу от 0 до 600? Разве косинус не связан между -1 и 1? Что мне не хватает? – foebu

+0

Цвет - это не расстояние, а входные данные. –