2015-09-17 1 views
0

После вычисления расстояний, которые каждый элемент имеет друг с другом, каким должен быть следующий шаг для создания Дендограммы для полного метода ссылок?Как нарисовать Дендограмму для полного метода ссылок в алгоритме агломерационной иерархической кластеризации

ответ

1

Представьте, что у нас есть 6 элементов данных i1, i2, i3, i4, i5, i6, и их расстояния должны отображаться, как на следующей диаграмме.

 i1  i2  i3  i4  i5  i6 
--------------------------------------------- 
i1  - 
i2 d1.2  - 
i3 d1.3 d2.3  - 
i4 d1.4 d2.4 d3.4  - 
i5 d1.5 d2.5 d3.5 d4.5  - 
i6 d1.6 d2.6 d3.6 d5.6 d5.6 - 

Полное соединение означает дальний сосед. Так что это должно быть выражено в Дендограмме. Последнее значение вертикальной оси в дендограмме будет самым длинным.

Сначала возьмите пару, имеющую наименьшее расстояние. Если есть более одной пары с одинаковым значением расстояния, просто начните с пары, с которой вы столкнулись. [Предпочитаете идти по строкам и получать первую пару, которая натолкнулась на] Затем объедините эти две пары в дендрограмме с этим значением расстояния по вертикальной оси. [При рисовании дендрограммы лучше не маркировать значения осей в начале. Пометьте их при прохождении процесса, чтобы избежать перекрытия линий.]

Затем перейдите к следующей паре. Если эта новая пара влияет на пары, уже находящиеся в дендрограмме, проверьте, имеют ли эти расстояния от пар, которые могут быть созданы, более высокие значения, чем новое парное расстояние. Если это так, проигнорируйте новую пару и идите дальше. Если это не так, вы можете объединить их в дендрограмме с этим значением расстояния по вертикальной оси.

Например:

  • низкие расстояния является D2.3.
  • D2.3 D3.4 < < < .............. D2.4

Так i2 и i3 сливается в dendogram на значении в вертикальном ось d2.3. Следующая пара (i3, i4) влияет на i3 уже в дендрограмме, которая может скомпоновать другую пару (i2, i4). Поскольку его расстояние d2.4 намного выше, чем d3.4, эта новая пара (i3, i4) может быть проигнорирована без слияния.

Аналогичным образом вы можете нарисовать дендрограмму, изображающую самого дальнего соседа, с его самым дальним значением расстояния.