2016-02-23 2 views
0

Я только что начал работу с CoreNLP версии 3.6.0. Я загрузил эту версию с this website. Использование трубопровода командной строки, я был в состоянии выполнять стандартные аннотатор трубопровода, но столкнулся с проблемой с truecase комментатором:core nlp truecaseannotator не найден

Вот копия вывода терминала:

loadClassifier = Edu/Стэнфорд/NLP/Модели/truecase/truecasing.fast.caseless.qn.ser.gz mixedCaseMapFile = edu/stanford/nlp/models/truecase/MixDisambiguation.list classBias = INIT_UPPER: -0.7, UPPER: -0.7, O: 0 Исключение из thread "main" edu.stanford.nlp.io.RuntimeIOException: java.io.IOException: Невозможно открыть «edu/stanford/nlp/models/truecase/truecasing.fast.caseless.qn.ser.gz» в качестве пути к классу, имя файла или URL at edu.stanford.nlp.ie.AbstractSequenceClassif ier.loadClassifierNoExceptions (AbstractSequenceClassifier.java:1499) на edu.stanford.nlp.pipeline.TrueCaseAnnotator. (TrueCaseAnnotator.java:58) в edu.stanford.nlp.pipeline.AnnotatorImplementations.trueCase (AnnotatorImplementations.java:199) на edu.stanford.nlp.pipeline.AnnotatorFactories $ 10.create (AnnotatorFactories.java:435) на edu.stanford.nlp.pipeline.AnnotatorPool.get (AnnotatorPool.java:85) на edu.stanford.nlp.pipeline. StanfordCoreNLP.construct (StanfordCoreNLP.java:375) на edu.stanford.nlp.pipeline.StanfordCoreNLP. (StanfordCoreNLP.java:139) на edu.stanford.nlp.pipeline.StanfordCoreNLP. (StanfordCoreNLP.java:135) на edu.stanford.nlp.pipeline.StanfordCoreNLP.main (StanfordCoreNLP.java:1222)

Любые идеи?

ответ

1

Мы попытались уменьшить размер контейнеров по умолчанию и решили не включать эту модель по умолчанию. Но он все еще содержится в английской модели jar, которую вы можете скачать с release history.

После того, как вы загрузили банку, не забудьте поставить ее в свой путь к классу перед запуском CoreNLP. Английская модель jar также должна содержать все в stanford-corenlp-3.6.0-models.jar, так что вам не понадобится их обоих в вашем пути к классам.

+0

Спасибо, это работает! Любая идея, как получить исправленный случай для входного предложения с использованием командной строки и использовать его в последующих аннотаторах? Например: «java -Xmx4g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize, ssplit, pos, lemma, truecase, ner, parse -file test.txt -outputFormat conll» с предложением типа «Это тестовое предложение Мне было бы интересно разобрать. "не дает ожидаемого" LIKE "= нравится. Очевидно, что я что-то пропустил ... – SimonD

+0

@ Шебастиан Шустер, любая идея, как добавить английскую модель к maven в pom.xml? Просто подключитесь к новой базе кода здесь и новым для maven. – Atticus29