1
Я хочу выбрать инструмент обработки естественного языка для выполнения общих задач, таких как токенизация, обнаружение предложений, различные тегирования (распознавание имен объектов, ...). мой вопрос состоит из двух частей:сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)
- Каковы критерии для выбора обработки естественного языка tool?
- Среди (UIMA, LingPipe, Lucene, Gate, Stanford), которые удовлетворяют эти критерии лучше?
и что вы предлагаете?
Не могли бы вы уточнить свои задачи? Сравнение действительно зависит от конкретных задач, которые вы хотите достичь. – Renaud
Инструмент Resourceware Workbench будет делать то, что вы упомянули, и выводить в словарь UIMA. Однако мой ответ потенциально предвзятый и неполный, поэтому я не ставил его в качестве ответа. –
UIMA не является инструментом NLP. Это структура взаимодействия и масштабирования, которая позволяет интегрировать такие инструменты в общую структуру. Существует несколько разновидностей коллекций компонентов UIMA, которые делают то, что вы хотите (например, DKPro Core, ClearTK, U-Compare и т. Д.), Некоторые из которых объединяют инструменты, которые вы упоминаете (например, LingPipe, Stanford и т. Д.). GATE находится где-то посередине. Если вы находитесь на Java, я бы предложил некоторые первые шаги с Apache OpenNLP (ASL) или Stanford CoreNLP (GPL), в зависимости от того, какую лицензию вы предпочитаете. - Разумеется, это вопрос мнения и не подходит для Stackoverflow. – rec