Возможно ли это: получить (аналогично) функциональность Stanford Named Entity Recognizer, используя только NLTK?Функциональность распознавателя Entity Recognizer (NER) Stanford с NLTK
Есть ли какой-нибудь пример?
В частности, меня интересует извлечение LOCATION часть текста. Например, из текста
Встреча будет проходить в 22 West Westin ул., Южная Каролина, 12345 на ноябрь-18
в идеале я хотел бы получить что-то вроде
(S
22/LOCATION
(LOCATION West/LOCATION Westin/LOCATION)
st./LOCATION
,/,
(South/LOCATION Carolina/LOCATION)
,/,
12345/LOCATION
.....
или просто
22 West Westin st., South Carolina, 12345
Вместо этого, я только в состоянии получить
(S
The/DT
meeting/NN
will/MD
be/VB
held/VBN
at/IN
22/CD
(LOCATION West/NNP Westin/NNP)
st./NNP
,/,
(GPE South/NNP Carolina/NNP)
,/,
12345/CD
on/IN
Nov.-18/-NONE-)
Обратите внимание, что если я ввожу свой текст в http://nlp.stanford.edu:8080/ner/process я получаю результаты далеки от совершенства (номер улицы и почтовый индекс по-прежнему не хватает), но по крайней мере, «ул. " является частью LOCATION, а Южная Каролина - РАСПОЛОЖЕНИЕ, а не «GPE/NNP»:?
Что я делаю неправильно, пожалуйста? как я могу исправить это, чтобы использовать NLTK для извлечения фрагмента места из некоторого текста?
Большое спасибо заранее!
Знаете ли вы, смогу ли я обучить Стэнфордского НЭР и как? Я попробовал. «Волшебник из страны Оз покидает Изумрудный город». и «Александр Великий покорил Империю Персии». Ничего не сработало. – Hans
@edfward java запускает его на порт 9191, но python запускает его на порт 8080. Почему? – bernie2436
@ akh2103 моя ошибка. Я исправился в ответ, они должны быть согласованы, в то время как фактический порт может меняться. – junjiah