Я пытаюсь использовать OpenNLP в проекте, в котором я работаю, и я очень новичок в нем. Я попытался использовать Именованное распознавание сущности с данными обучения, доступными по адресу http://opennlp.sourceforge.net/models-1.5/ Однако я хочу видеть данные обучения, которые были использованы. т.е. фактически открыть файл .bin и просмотреть его содержимое на английском языке. Может ли кто-нибудь указать мне в правильном направлении. Я пытался использовать UltraISO для чтения .bin-файла, но я не был успешным. PLs help !! Thanx :)Как просмотреть содержимое .bin-файла в opennlp
0
A
ответ
0
Используйте команду Unix file
, чтобы найти тип файла, например file en-token.bin
. Для большинства файлов OpenNLP .bin он скажет вам, что это только файлы ZIP.
0
Файл bin на самом деле является байтами сериализованного java-объекта, представляющего реализацию TokenNameFinder, называемую NameFinderME (ME означает максимальную энтропию, которая является основным алгоритмом многомерной логистической регрессии (ish), используемым в OpenNLP). Вы не сможете увидеть данные обучения, сделав что-нибудь в этом файле. Исправление: это не поисковик имен, это сериализуется имяfinderMODEL.
'bin' - это расширение * общего * файла, указывающее, что файл может быть любым *, но * простым текстом. (В частности, это не имеет никакого отношения к «ISO».) Вам нужно «Правильное программное обеспечение», чтобы открыть его или найти спецификации формата файла где-нибудь и написать программное обеспечение для его чтения. – usr2564301