2

У меня есть словарь именованных объектов, извлеченный из Википедии. Я хочу использовать его в качестве словаря NER. Я хотел знать, как я могу использовать Stanford-NER с этими данными. Я также загрузил Lingpipe, хотя я понятия не имею, как его использовать. Я был бы признателен за все виды информации.Точное распознавание сущности на основе словаря со Stanford

Спасибо за помощь.

+0

LingPipe имеет NE учебник здесь, который охватывает регулярное выражение, точное и статистическое изъятие искомого объекта: http://alias-i.com/lingpipe/demos/tutorial/ne/read-me.html Это серверный Java API с демонстрационными примерами запуска из командной строки в учебнике. –

ответ

3

Вы можете использовать словарь (или основанное на регулярной основе) распознавание сущности с помощью Stanford CoreNLP. См. RegexNER annotator. Для некоторых приложений мы запускаем это с довольно большими словарями сущностей. Тем не менее, для нас это, как правило, является вторичным инструментом для использования статистических (CRF-based) NER.

1

Stanford-NER основан на CRF, который является статистической моделью. Боюсь, что он не поддерживает дополнительный словарь или лексику. Тем не менее, вы можете обучить новую модель в соответствии с вашей собственной задачей.

+0

Спасибо @Friedmannn. Я немного читал о Стэнфорде НЭР и понял, как он работает. Я также пытался использовать его «Ведомости», но не помог. Я переключился на LingPipe, и это работает нормально. – Hedieh