ответ

5

В их documentation указано: способность релевантности определяет важность каждого уникального объекта и присваивает оценку релевантности в диапазоне 0-1 (1 является наиболее актуальным и важным).

В то время как они не объясняют, что означает «релевантность», можно было бы ожидать, что он будет количественно определять центральность объекта для дискурса документа. На него, вероятно, влияют такие факторы, как субъекты, упоминающие частоту в этом документе, по сравнению с ожидаемой частотой в случайном документе (см. TF-IDF), но также могут включать более сложный анализ дискурса.

+0

Спасибо, Джон. Как вы думаете, это вероятностный балл? Поскольку они выражают это как процент, мне было интересно, может ли это быть вероятностным счетом, но у меня есть сильное чувство, что это не так. Что вы думаете об этом? Мое приложение отображает текстовые документы в важные объекты в них. Какой диапазон баллов, по вашему мнению, указывает на то, что достаточно важно сопоставить документ? Я был бы благодарен за ваш ответ. – Ninja

+0

Привет, ниндзя. Я могу только догадываться, но я бы предположил, что это не настоящая вероятность. Мой лучший совет - запустить эксперименты и посмотреть, что вам нравится. Бьюсь об заклад, вы можете выбрать разумный порог в течение 10 или 15 минут анализа данных. Вы будете вынуждены принять решение, по которому важнее: пропустить важные объекты или включить сомнительные. Но это довольно субъективно. –

+0

Хорошо спасибо за совет! – Ninja