Я новичок в Mallet и пытаюсь использовать его функции CRF для выполнения Named Entity Recognition. Я знаю, что есть пример, показывающий, как импортировать данные с помощью Java на свой веб-сайт, но он имеет дело с обычными текстами (не в формате обучаемого набора). Теперь у меня есть данные обучения, доступные в следующем формате (точный формат, как показано на веб-сайте). Первый столбец - это слово, а второй столбец - метка.Как импортировать данные с помощью API-интерфейсов Mallet
a O
50 AGE
year AGE
old O
man GENDER
with O
a O
history O
of O
suicide O
attempt O
experienced O
an O
epileptic O
seizure O
on O
22-dec-01 DATE
. O
----
Примечание: Это не видно в воспроизведенной выходной, но это, кажется, разделенные табуляцией
Так что теперь я застрял. Как импортировать вышеуказанные данные в качестве набора для обучения с использованием API-интерфейса Mallet?
Я знаю, как это сделать в командной строке, но я хотел бы закодировать JAVA, чтобы в будущем я мог добавить еще несколько функций, используя их API.
пост, что вы пытались – GANI
я просто использовал командную строку, которая находится на своем веб-сайте. Теперь я хочу использовать Java-код, но я не совсем уверен, какие классы и методы использовать для загрузки набора данных (fomatted, как указано выше) в экземпляры. –