2009-08-09 2 views
1

Я начал работу над проектом, в котором я должен пометить документы ключевыми словами, и это очень сложно и требует много времени, если вы сделаете это вручную (особенно если у вас тысячи документов). Поэтому я планирую автоматизировать процесс (зная, что результат не будет идеальным, но, по крайней мере, он дает вам некоторые предложенные теги). В последней версии firefox они реализовали такую ​​систему (при закладке страницы она предлагает вам несколько тегов).связанный с автоматической привязкой документов

yahoo term extraction сервис также отличный пример

Так что, если какой-либо орган может помочь мне обойти эту проблему, я бы очень признателен за помощь. Или, если кто-то знает о системе тегов firefox, немного поможет.

ответ

1

Будет ли статистический алгоритм работать? Возможно, что-то байесовское? Я знаю, что они используются в фильтрации спама, возможно, вы можете адаптировать фильтр Bayes в соответствии с вашими потребностями.

По крайней мере, вы можете предлагать слова, которые часто используются, но не являются общепринятыми словами на английском языке (он, она, я, и, это, то, или, и т. Д.)

 Смежные вопросы

  • Нет связанных вопросов^_^