2011-12-18 4 views
4

Почему DBpedia использует несколько словарей для одних и тех же атрибутов?
Мне нужно получить данные обо всех возможных фильмах. Для каждого фильма я заметил, что у него есть DBpedia филин и dbpprop словарь для продюсеров, режиссеров и так далее .. я получить атрибут с помощью следующего запроса:Почему 2 разных словаря для одного и того же атрибута в DBpedia?

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 

PREFIX foaf: <http://xmlns.com/foaf/0.1/> 

SELECT ?star_name 
WHERE { 
<http://dbpedia.org/resource/Goal_III:_Taking_on_the_World> dbpedia-owl:starring ?star. 
?star foaf:name ?star_name 
} 

Я буду иметь идентификатор страницы каждого фильма, а затем я буду получать звезды и продюсеров. Для некоторых я думаю, dbpedia-owl работает и для некоторых работ dbpprop.

Я озадачен этим. Мне нужно написать код в Python для запуска этого запроса для каждого фильма. Поэтому каждый раз, когда мне нужно будет проверить, что результат равен нулю, а затем запустите код для другого словаря.

ответ

1

Данные DBPedia извлекаются с использованием картографического языка из информационных полей, которые вы видите на соответствующих страницах википедии. Для разных информационных полей используются разные сопоставления, поэтому два разных типа ресурса могут отображаться совершенно по-разному, что совершенно логично, если вы думаете об этом.

Теперь проблема, о которой вы говорите, состоит в том, что два ресурса одного типа с одинаковыми данными, отображаемыми по-разному. Я подозреваю (хотя не могу подтвердить, потому что вы не приводили примеры двух фильмов, которые отображают свойства по-разному), что проблема здесь - данные в Википедии. Возможно, существует более одного способа выразить интересующую вас информацию в информационном окне и что сопоставление для информационного окна отличается по-разному разными способами. Это не идеально, но у Википедии нет прекрасных чистых данных, поэтому вы не должны ожидать, что DBPedia также получит чистые данные.

Вы можете задать вопрос по списку рассылки DBPedia по телефону [email protected], чтобы узнать, почему это происходит, поскольку они будут лучше размещены, чтобы помочь вам.

 Смежные вопросы

  • Нет связанных вопросов^_^