2015-08-09 2 views
0

Я пытаюсь использовать ELKI (среда для разработки KDD-приложений, поддерживаемых индексами-структурами) для иерархической кластеризации. Поэтому несколько дней назад я импортировал исходный код ELKI (проекты Maven), а затем запускаю miniGUI.Использование исходного кода ELKI для иерархической кластеризации

Мои вопросы:

  1. Я хочу использовать ResultVisulizer результата. Однако я обнаружил, что в Resulthandler нет элемента ResultVisulizer. Что делать, чтобы этот элемент ResultVisulizer был указан здесь?

  2. Я хочу видеть дендрограмму иерархической кластеризации. Какие параметры необходимо установить для этого miniGUI для этой цели?

ответ

0
  1. Чтобы включить SVG визуализатор, включите svgMaven профиль. SVG добавляет около 17 МБ зависимостей, поэтому мы решили сделать это дополнительным модулем.

  2. В настоящее время в ELKI отсутствует визуализация дендрограмм, так как такие визуализации не очень масштабируемы; с более чем несколькими десятками экземпляров их становится трудно читать. Кроме того, на многих интересных наборах данных расстояния (высоты) слишком похожи, так что дендрограмма снова не очень полезна, к сожалению.

    Если вы извлеките кластеры и упростите иерархию, ELKI отобразит дерево иерархии кластера, но не будет использовать информацию о высоте (по причинам выше и по соображениям удобочитаемости). ELKI имеет мощные методы извлечения кластеров из иерархической кластеризации, которые недоступны в R.

    Приглашаем вас представить визуализацию дендрограмм; но попробуйте сделать его полезным для широкой пользовательской базы без необходимости слишком большой настройки.

Вот пример из R (Source), почему я не уверен в дендрограмм (и почему это низко на моем личном списке приоритетов - кто-то должен будет внести свой вклад в это ELKI): Dendrogram fail