Я хотел бы использовать именованное распознавание объектов (NER) для поиска адекватных тегов для текстов в базе данных.Алгоритмы распознавания именных объектов
Я знаю, что есть статья в Википедии об этом и многих других страницах, описывающих ЯЭР, я бы желательно услышать что-то по этой теме от вас:
- Какого опыта вы сделали с различными алгоритмами?
- Какой алгоритм вы бы порекомендовали?
- Какой алгоритм проще всего реализовать (PHP/Python)?
- Как работают алгоритмы? Необходима ли ручная подготовка?
Пример:
"В прошлом году я был в Лондоне, где я видел Барака Обаму." => Тэги: Лондон, Барак Обама
Надеюсь, вы можете мне помочь. Заранее большое спасибо!
+1 для предложения nltk – pufferfish
NLTK звучит неплохо, но требует установки через оболочку, не так ли? Я ничего не могу установить через оболочку. – caw
Что вы подразумеваете под установкой через оболочку? Проверьте http://www.nltk.org/download, достаточно, если вы просто добавите nltk в свой PYTHONPATH. – Ale