2016-09-15 11 views
0

Я новичок в Mallet и пытаюсь использовать его функции CRF для выполнения Named Entity Recognition. Я знаю, что есть пример, показывающий, как импортировать данные с помощью Java на свой веб-сайт, но он имеет дело с обычными текстами (не в формате обучаемого набора). Теперь у меня есть данные обучения, доступные в следующем формате (точный формат, как показано на веб-сайте). Первый столбец - это слово, а второй столбец - метка.Как импортировать данные с помощью API-интерфейсов Mallet

a O 
50 AGE 
year AGE 
old O 
man GENDER 
with O 
a O 
history O 
of O 
suicide O 
attempt O 
experienced O 
an O 
epileptic O 
seizure O 
on O 
22-dec-01 DATE 
. O 
---- 

Примечание: Это не видно в воспроизведенной выходной, но это, кажется, разделенные табуляцией

Так что теперь я застрял. Как импортировать вышеуказанные данные в качестве набора для обучения с использованием API-интерфейса Mallet?

Я знаю, как это сделать в командной строке, но я хотел бы закодировать JAVA, чтобы в будущем я мог добавить еще несколько функций, используя их API.

+0

пост, что вы пытались – GANI

+0

я просто использовал командную строку, которая находится на своем веб-сайте. Теперь я хочу использовать Java-код, но я не совсем уверен, какие классы и методы использовать для загрузки набора данных (fomatted, как указано выше) в экземпляры. –

ответ

0

Вы можете прочитать учебные примеры с использованием FileIterator или CSVIterator или ArrayIterator в молотке. Вы можете найти использование CSVIteartor по адресу http://mallet.cs.umass.edu/classifier-devel.php. Использование FileIterator и ArrayIterator доступно по адресу http://www.programcreek.com/java-api-examples/index.php?api=cc.mallet.pipe.iterator.FileIterator и http://www.programcreek.com/java-api-examples/index.php?api=cc.mallet.pipe.iterator.Arrayiterator соответственно.

Вы можете найти информацию о том, как использовать ХПН через Java код в молотом на http://www.programcreek.com/java-api-examples/index.php?api=cc.mallet.fst.CRF

+0

Большое спасибо. Это помогает! –

 Смежные вопросы

  • Нет связанных вопросов^_^