Понимание Точность релевантности OpenCalais

Я пытаюсь понять, что такое показатель соответствия, который возвращает opencalais, связанный с каждым объектом? Что это означает и как его интерпретировать? Я был бы благодарен за понимание этого.Понимание Точность релевантности OpenCalais

источник

2011-01-08 Ninja

В их documentation указано: способность релевантности определяет важность каждого уникального объекта и присваивает оценку релевантности в диапазоне 0-1 (1 является наиболее актуальным и важным).

В то время как они не объясняют, что означает «релевантность», можно было бы ожидать, что он будет количественно определять центральность объекта для дискурса документа. На него, вероятно, влияют такие факторы, как субъекты, упоминающие частоту в этом документе, по сравнению с ожидаемой частотой в случайном документе (см. TF-IDF), но также могут включать более сложный анализ дискурса.

источник

2011-01-08 23:15:34

Спасибо, Джон. Как вы думаете, это вероятностный балл? Поскольку они выражают это как процент, мне было интересно, может ли это быть вероятностным счетом, но у меня есть сильное чувство, что это не так. Что вы думаете об этом? Мое приложение отображает текстовые документы в важные объекты в них. Какой диапазон баллов, по вашему мнению, указывает на то, что достаточно важно сопоставить документ? Я был бы благодарен за ваш ответ. – Ninja

Привет, ниндзя. Я могу только догадываться, но я бы предположил, что это не настоящая вероятность. Мой лучший совет - запустить эксперименты и посмотреть, что вам нравится. Бьюсь об заклад, вы можете выбрать разумный порог в течение 10 или 15 минут анализа данных. Вы будете вынуждены принять решение, по которому важнее: пропустить важные объекты или включить сомнительные. Но это довольно субъективно. –

Хорошо спасибо за совет! – Ninja

Понимание Точность релевантности OpenCalais

ответ

Смежные вопросы