2016-02-15 2 views
0

то, что я дал это Разбивается на лексемы текста, что-то вродеразрешения кореферентности для токенизированного текста в Стэнфорд

«Лета 2005 года, картины, что люди уже давно ищут вперед T -1 начался * -2 с частотой в различных основных средствах ».

и мне нужно, чтобы получить как результат разрешения кореферентности из Стэнфорда, но я хочу начать с шагов после tokenizing, может кто-то помочь мне в том, что я получил жетоны, и я пытаюсь создать приговор аннотацию, но она дает null, может кто-нибудь помочь (я прочитал сообщение Coreference resolution using Stanford CoreNLP), это было полезно, но не достаточно.

ответ

0

Попробуйте установить tokenize.whitespace. Это укажет токенизатору на токенизацию в пробеле; т. е. рассматривать текст как уже обозначенный.

+0

Большое спасибо, это именно то, что мне нужно, также, если возможно, у меня есть еще вопросы о Стэнфорде, можете ли вы помочь мне с ними, если у вас есть время (а не вопросы программирования) – Kinda