2014-10-01 2 views
0

Я пытаюсь использовать OpenNLP в проекте, в котором я работаю, и я очень новичок в нем. Я попытался использовать Именованное распознавание сущности с данными обучения, доступными по адресу http://opennlp.sourceforge.net/models-1.5/ Однако я хочу видеть данные обучения, которые были использованы. т.е. фактически открыть файл .bin и просмотреть его содержимое на английском языке. Может ли кто-нибудь указать мне в правильном направлении. Я пытался использовать UltraISO для чтения .bin-файла, но я не был успешным. PLs help !! Thanx :)Как просмотреть содержимое .bin-файла в opennlp

+0

'bin' - это расширение * общего * файла, указывающее, что файл может быть любым *, но * простым текстом. (В частности, это не имеет никакого отношения к «ISO».) Вам нужно «Правильное программное обеспечение», чтобы открыть его или найти спецификации формата файла где-нибудь и написать программное обеспечение для его чтения. – usr2564301

ответ

0

Используйте команду Unix file, чтобы найти тип файла, например file en-token.bin. Для большинства файлов OpenNLP .bin он скажет вам, что это только файлы ZIP.

0

Файл bin на самом деле является байтами сериализованного java-объекта, представляющего реализацию TokenNameFinder, называемую NameFinderME (ME означает максимальную энтропию, которая является основным алгоритмом многомерной логистической регрессии (ish), используемым в OpenNLP). Вы не сможете увидеть данные обучения, сделав что-нибудь в этом файле. Исправление: это не поисковик имен, это сериализуется имяfinderMODEL.