Я пытаюсь найти тип слов, соответствующих им во многих категориях (дата, год, время, имена, знаки препинания, электронная почта и т. Д.). Я создавал свой собственный код для обнаружения этого (и работал), но я нашел библиотеки, такие как ANTLR и JavaCC.Какую библиотеку я могу использовать для разбора слов в Java?
Что я хочу сделать для этих библиотек? Если да, то что я должен использовать, если нет, есть что-то, что я могу использовать для этого?
Каковы рекомендации? JavaCC, ANTRL, есть еще несколько? Я вижу, что JavaCC генерирует некоторые классы, но есть вещи, которые я не хочу, чтобы это делалось как токенизация.
ну, если у вас есть возможность использовать Jython, я думаю, вы можете использовать NLTK через это (и, следовательно, использовать его в своем проекте java) –