2015-02-25 1 views
-1

Я хочу разобрать все имя человека из входных текстовых данных. Я уже пробовал это, используя Stanford Java NER library, но он не дает точных ответов на имена индейцев. Можно ли создавать настраиваемые классификаторы? или существует какой-либо другой метод для синтаксического анализа имен с использованием других методов НЛП с максимальной точностью.Parsing People Имя из большого текста с использованием NER

EDIT: Я дал случайный текст в качестве ввода, содержащего имена многих людей, в приложение GUI Stanford Named Entity Recognizer version 3.5.1 Но это очень не так точно. Он не распознает большинство имен.

+0

Пожалуйста, не задавайте общие вопросы. Расскажите нам, что вы пробовали, и как это произошло. Какой подход, по крайней мере, дал некоторые базовые результаты. Люди здесь могут предложить улучшения. – rishi

ответ

0

Документация NLP от Stanford сообщает, что вы можете обучать свою собственную модель NER. Вот ссылка на [FAQ] [1] [1]: http://nlp.stanford.edu/software/crf-faq.shtml. Вы можете использовать умеренно насыщенный текст с именами людей и использовать его в обучении.

Существуют и другие инструменты (например, GATE), имеющие список имен лиц, которые могут быть изменены.

Также посмотрите в NLTK, LingPipe, FreeLing и т. Д., Которые являются другими популярными библиотеками НЛП.