Итак, у меня есть набор текстов, на которые я бы хотел сделать анализ кластеризации. Я взял Normalized Compression Distance между каждым текстом, и теперь я в основном построен полный граф с взвешенными дугами, который выглядит примерно так:Как подключить данные о расстоянии в агломерационные методы кластеризации Scipy?
text1, text2, 0.539
text2, text3, 0.675
У меня огромные трудности выяснить, лучший способ заткнуть эти данные в методы иерархической кластеризации Scipy. Вероятно, я могу преобразовать данные о расстоянии в таблицу, подобную таблице this page. Как я могу отформатировать эти данные, чтобы их можно было легко подключить к коду HAC scipy?