2014-09-24 4 views
2

Я использую уместность rdfs:type равного dbpedia-owl:Organisation для выбора (очевидно) организаций на моем SPARQL запроса:Яго онтология для лица неоднозначности

SELECT ?s 
WHERE { 
    ?s a dbpedia-owl:Organisation . 
} LIMIT 10 

Я хотел бы рассмотреть Яго~d онтологию для повышения моего выступления на получение реального организаций. Например, ФБР (http://dbpedia.org/resource/Federal_Bureau_of_Investigation) не считается dbpedia-owl: Organization, но помечено как yago: Organization108008335.

Обратите внимание на «случайный» номер (по крайней мере для меня) в конце имени класса. Кто-нибудь знает, что означает это число? Как я могу предположить это априори?

Более того, когда я смотрю на несколько классов с этим форматом (используя ниже запроса), можно найти еще два класса: http://dbpedia.org/class/yago/Organization108008335, http://dbpedia.org/class/yago/Organization101008378, http://dbpedia.org/class/yago/Organization101136519

SELECT DISTINCT ?t WHERE { 
    ?s a ?t 
    FILTER(regex(str(?t), "http://dbpedia.org/class/yago/Organization\\d+")) 
} 

Отличаются ли они? Почему они не все «yago:Organization». Должен ли я ожидать, что «новые» организационные классы станут доступными для новых версий онтологий YAGO? Есть ли какой-либо другой класс, который я должен учитывать при выборе Организации?

ответ

2

я копал в это последнее время, так что я постараюсь ответить на все ваши вопросы один за другим:

Обратите внимание на «случайный» (по крайней мере для меня) число в конце класса имя. Кто-нибудь знает, что означает это число? Как я могу предположить это априори?

Это число соответствует synset id слова в Wordnet. Например, если вы посмотрите на wordnet_organization_101136519 в wordnet (URI в dbpedia в данный момент не разрешимо, возможно, они что-то изменили в последних выпусках), вы увидите, что у него есть synsetID «101136519». Я не думаю, что вы можете знать это априори, не глядя в wordnet.

Разные ли они? Почему они не все «Яго: Организация».

Они разные, потому что они имеют другое определение в wordnet. Например:

wordnet_organization_101136519: «Деятельность или результат распределения или распоряжения лицами или вещи надлежащим образом или методично» его организация рабочей силы была очень эффективной ». Пример экземпляра: Bogo-Indian_Defence. См. Более подробную информацию here

wordnet_organization_101008378: «акт организации бизнеса или деятельности, связанной с бизнесом», который был привлечен для контроля за организацией нового отдела ». Пример экземпляра: Adam_Smith_Foundation. См. Более подробную информацию. here

Если вы следуете приведенным ссылкам, вы увидите больше различий и общее сходство.

Должен ли я ожидать, что «новые» организационные классы станут доступными для новых версий онтологий YAGO?

Когда они сгенерировали Яго, они связывали каждое слово в wordnet с URI. Если добавлено больше слов об организациях, я думаю, что у вас будет больше определений. Однако это невозможно узнать заранее.

Есть ли какой-либо другой класс, который я должен учитывать при выборе Организации?

Вы можете искать все классы с меткой «организация» в wordnet, а затем добавлять дополнительные варианты в свой запрос (или выдавать один запрос на класс, получая интересующие вас организации). These are the classes with the "organization" label in Wordnet.

Надеюсь, это поможет.