2016-10-13 5 views
0

Я использую maven для управления зависимостями. Мне нужно использовать Stanford NLP Parser для получения универсальных зависимостей для английских предложений. Я использую модель edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz. Мой pom.xml содержит следующиеStanford NLP Parser Model Jar слишком большой

<dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
    </dependency> 
    <dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
     <classifier>models</classifier> 
    </dependency> 

Добавляя зависимость моделей, увеличение размера банка от около 300Мб. Мне нужно убедиться, что банка как можно меньше. Есть ли способ справиться с этим в maven?

ответ

0

Вы можете сделать кувшин меньшим, не включая модели, и ссылаться на них из других мест (то есть указать собственный путь для свойства parse.model), но в целом, если вы хотите создать деревья синтаксического анализа, вам нужно есть модель парсера, доступная где-то. CoreNLP по умолчанию включает его в модельную банку, чтобы упростить запуск кода независимо от вашей конкретной структуры каталогов.

Другой вариант - запустить сервер CoreNLP, а затем вам нужна только клиентская библиотека (сервер включает в себя банку моделей).