Я пытаюсь создать интерфейс для WOLF (Wordnet Libre du Français, Free French Wordnet). Целью является тиражирование AWNDatabaseManger для арабского Wordnet (http://www.talp.upc.edu/index.php/technology/resources/multilingual-lexicons-and-machine-translation-resources/multilingual-lexicons/72-awn), но для WOLF.WOLF (Wordnet Libre du Français, Free French Wordnet)
Проблемы я столкнулся в том, что я не могу найти соответствующие спецификации данных для WOLF (http://alpage.inria.fr/~sagot/wolf-en.html) или WoNeF (который является другим французским tranlated Wordnet http://wonef.fr/)
Для арабского Wordnet они дали подробные спецификации данных, которые могут быть найдено на http://globalwordnet.org/arabic-wordnet/awn-data-spec/ Я пытаюсь найти то же самое для WOLF или WoNeF.
В противном случае, как мне сопоставить два файла?
например, слово и его отношение в остях выглядеть следующим образом:
<item itemid="$ajarap_AlS~amog_n1AR" offset="111586059" lexfile="" name="شَجَرَة الصَّمْغ " type="synset" headword="" POS="n" source="" gloss="" authorshipid="80" />
<word wordid="$ajarap__1" value="شَجَرَة الصَّمْغ " synsetid="$ajarap_AlS~amog_n1AR" frequency="" corpus="" authorshipid="11461" />
<link type="has_hyponym" link1="$ajarap_AlS~amog_n1AR" link2=">ukAlibotws_n1AR" authorshipid="35038" />
<link type="has_hyponym" link1="$ajarap_n1AR" link2="$ajarap_AlS~amog_n1AR" authorshipid="35041" />
Слово Defintion (пункт), и это отношение (ссылка) разделяется с различными атрибутами.
, тогда как в WOLF слова, и это отношение выглядеть следующим образом:
<SYNSET>
<ILR type="near_antonym">eng-30-00002098-a</ILR>
<ILR type="be_in_state">eng-30-05200169-n</ILR>
<ILR type="be_in_state">eng-30-05616246-n</ILR>
<ILR type="eng_derivative">eng-30-05200169-n</ILR>
<ILR type="eng_derivative">eng-30-05616246-n</ILR>
<ID>eng-30-00001740-a</ID>
<SYNONYM>
<LITERAL lnote="2/2:fr.csbgen,fr.csen">comptable</LITERAL>
</SYNONYM>
<DEF>(usually followed by `to') having the necessary means or skill or know-how or authority to do something
</DEF>
<USAGE>able to swim</USAGE>
<USAGE>she was able to program her computer</USAGE>
<USAGE>we were at last able to buy a car</USAGE>
<USAGE>able to get a grant for the project</USAGE>
<BCS>3</BCS>
<POS>a</POS>
</SYNSET>
я могу сделать предположение, что Аун атрибута лоска равно волк использования тегов и атрибуты ости позы равны волком тегов поз.
Но я не хочу делать предположения, я ищу подходящую документацию, из которой я могу быть уверен, и заключить сопоставления между этими двумя файлами.
Может ли кто-нибудь указать мне нужные документы?
попробовать: compling.hss.ntu.edu.sg/omw/ с http://www.nltk.org/_modules/nltk/corpus/reader/wordnet.html – alvas