сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)

Я хочу выбрать инструмент обработки естественного языка для выполнения общих задач, таких как токенизация, обнаружение предложений, различные тегирования (распознавание имен объектов, ...). мой вопрос состоит из двух частей:сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)

Каковы критерии для выбора обработки естественного языка tool?
Среди (UIMA, LingPipe, Lucene, Gate, Stanford), которые удовлетворяют эти критерии лучше?

и что вы предлагаете?

источник

2013-09-18 aliakbarian

Не могли бы вы уточнить свои задачи? Сравнение действительно зависит от конкретных задач, которые вы хотите достичь. – Renaud

Инструмент Resourceware Workbench будет делать то, что вы упомянули, и выводить в словарь UIMA. Однако мой ответ потенциально предвзятый и неполный, поэтому я не ставил его в качестве ответа. –

UIMA не является инструментом NLP. Это структура взаимодействия и масштабирования, которая позволяет интегрировать такие инструменты в общую структуру. Существует несколько разновидностей коллекций компонентов UIMA, которые делают то, что вы хотите (например, DKPro Core, ClearTK, U-Compare и т. Д.), Некоторые из которых объединяют инструменты, которые вы упоминаете (например, LingPipe, Stanford и т. Д.). GATE находится где-то посередине. Если вы находитесь на Java, я бы предложил некоторые первые шаги с Apache OpenNLP (ASL) или Stanford CoreNLP (GPL), в зависимости от того, какую лицензию вы предпочитаете. - Разумеется, это вопрос мнения и не подходит для Stackoverflow. – rec

Некоторой общих Критерии:

сколько заданий можно выполнить прилагаемые модели (например, это средство содержит модели для моих задач, таких как испанские токенизации или белки НЭК)?
Как легко мне добавить недостающие инструменты.

BTW, я бы добавил NLTK в ваш список и его excellent, free accompanying book.

источник

2013-09-18 12:36:20 Renaud

сравнение инструментов обработки естественного языка (UIMA, LingPipe, Lucene, Gate, Stanford)

ответ

Смежные вопросы