Я использую GATE для арабского языка под Linux, а при использовании Stanford Tagger нет никаких тегов POS. Все параметры не были изменены (по умолчанию), что я могу сделать для выполнения этой задачи? Зависит ли эта проблема от параметров? Какой каталог установки теггера должен быть установлен в параметре taggerBinary?Stanford Tagger с GATE
1
A
ответ
1
Прежде всего вам нужно создать новый StanfordPOSTaggerPR в GATE и инициализировать Tagger с помощью модели , снабженной StanfordTagger.
Последняя версия GATE - это 8.0, и она использует StanfordTagger 3.4. Поэтому вам придется загружать модели, поставляемые с этой версией.
Далее, вы должны создать мозолистое трубопровод с SentenceSplitter и Tokeniser (я попытался с UnicodeTokeniser
и RegExp SentenceSplitter
):
Наконец, попробуйте трубопровод с образцом: