Я все еще занимаюсь исследованием кластеров, сформированных с использованием кластеризации (неконтролируемое обучение)?Как оценить кластеризацию?
Я пробовал искать, но меры, которые я получаю, слишком теоретические. Будет здорово, если люди смогут поделиться механизмами, которые они используют, для оценки сформированных кластеров. Скажем, у меня есть кластер Java, который будет содержать Java EE, Java ME, RMI, JVM и т. Д., Другой кластер говорит NoSQL, и у него будет что-то вроде Neo4j, OrientDB, CouchDB и т. Д. Это прекрасно, и мой алгоритм кластеризации дал мне больше всего точные кластеры.
Однако после обучения, а затем тестирования я могу сказать MySQL, Oracle в кластере NoSQL, поэтому я просто выполняю ручную/визуальную интерпретацию, а затем переучиваю свой алгоритм или настраиваю его, чтобы улучшить кластеризацию.
Теперь я хочу автоматизировать этот процесс визуализации кластеров вручную и иметь систему, которая дает мне точность сформированных кластеров. Я ищу что-то похожее на точность, отзыв, NDCG, карту и т. Д., Используемые в поиске. Мои кластеры различаются по длине, и может быть n - другой кластер, сформированный таким образом, чтобы точность/отзыв не были правильными.
Спасибо за эту информацию. Ваш пост определенно полезен. – Yavar
Надеюсь, это поможет! Я с нетерпением жду, чтобы узнать, как этот проект закончился –