Я пытаюсь запустить pycorenlp по длинному тексту и получить сообщение об ошибке CoreNLP request timed out. Your document may be too long
. Как это исправить? Есть ли способ увеличить время ожидания Stanford CoreNLP?pycorenlp: «Запрошен запрос CoreNLP. Ваш документ может быть слишком длинным»
Я не хочу сегментировать текст в меньшие тексты.
Вот код, я использую:
'''
From https://github.com/smilli/py-corenlp/blob/master/example.py
'''
from pycorenlp import StanfordCoreNLP
import pprint
if __name__ == '__main__':
nlp = StanfordCoreNLP('http://localhost:9000')
fp = open("long_text.txt")
text = fp.read()
output = nlp.annotate(text, properties={
'annotators': 'tokenize,ssplit,pos,depparse,parse',
'outputFormat': 'json'
})
pp = pprint.PrettyPrinter(indent=4)
pp.pprint(output)
Стэнфордский Ядро NLP Сервер был запущен с помощью:
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer 9000
Похоже, они это делают сейчас но кажется, что нет неограниченного таймаута, и они также не указывают максимальное значение в документах. – displayname
@displayname Один шаг за раз:/ –
Да, к сожалению [проблема, с которой я сейчас сталкиваюсь] (http://stackoverflow.com/questions/39809061/edu-stanford-nlp-io-runtimeioexception-could-not- connect-to-server) может иметь какое-то отношение к проблеме тайм-аута или что-то в этом роде. – displayname