2013-03-07 3 views
0

Я реализую небольшую систему CRM. и концепция интеллектуального анализа данных для прогнозирования и поиска возможностей и тенденций имеет важное значение для таких систем. Один подход к интеллектуальному анализу данных - кластеризация. Это очень маленький проект CRM и использование java для предоставления интерфейса для поиска информации из базы данных.Является ли метка формой интеллектуального анализа данных?

Вопрос в том, что когда я вставляю клиента в базу данных, у меня есть текстовое поле, которое позволяет клиентам помечать их по пути в базу данных, то есть точку регистрации.

Рассматриваете ли вы технику мечения как кластеризация? Если да, то это техническая информация ?

Я уверен, что существует сложный API, такой как Java Data Mining API, который позволяет осуществлять интеллектуальный анализ данных. Но ради моего проекта я просто хотел знать, может ли пометка пользователей ключевым словом, таким как stackoverflow, позволяет помечать ключевые слова в вопросе размещения, является формой интеллектуального анализа данных, поскольку с помощью этих помеченных слов можно легко найти тенденции и шаблоны путем поиска.

+0

Как вычисляется тег? Есть ли одно ключевое слово или несколько? –

+0

один или несколько – MooHa

+0

Нет, * пометка * не является добычей данных или * кластеризация *. Потому что это руководство и не основано на сложной статистике. Забудьте о JDM API, он мертв годами. –

ответ

1

Чтобы сделать его коротким, да, теги - это дополнительная информация, которая облегчит проведение анализа данных позже.

Их, вероятно, будет недостаточно. Теги привязаны к сущностям и, в зависимости от того, как вы их вычисляете, они могут не показывать интересные отношения между разными объектами. С вашей системой тегов единственное отношение, которое я вижу, - это «тот же тег», и этого может быть недостаточно.

Кластеризация ваших данных может быть выполнена с использованием методов обнаружения сообщества на графиках, построенных с использованием ваших данных и отношений между объектами. Этот пример находится в Python и использует библиотеку networkx, но он может дать вам представление о том, что я говорю: http://perso.crans.org/aynaud/communities/

+0

благодарим вас за ввод – MooHa