Содержимое DBpedia находится в формате RDF. Дампы можно скачать с here
Dbpedia - это большой набор данных в RDF, для обработки такого количества данных, которое необходимо использовать для использования технологии Triple Store. Для Dbpedia вам понадобится один из родных трехместных магазинов, я рекомендую использовать либо Virtuoso, либо 4store. Я лично предпочитаю 4-й магазин.
Как только у вас есть трёхместный магазин с Dbpedia. Вы можете использовать SPARQL для запроса тройников Dbpedia RDF. Есть библиотеки Python, которые могут помочь вам в этом. 4store и Virtuoso могут дать вам результаты в JSON, чтобы вы могли легко обойтись без каких-либо библиотек.
Некоторые простые URLLIB сценарий как ...
def query(q,epr,f='application/json'):
try:
params = {'query': q}
params = urllib.urlencode(params)
opener = urllib2.build_opener(urllib2.HTTPHandler)
request = urllib2.Request(epr+'?'+params)
request.add_header('Accept', f)
request.get_method = lambda: 'GET'
url = opener.open(request)
return url.read()
except Exception, e:
traceback.print_exc(file=sys.stdout)
raise e
может помочь вам запустить SPARQL ... например
>>> q1 = """
... select ?birthPlace where {
... <http://dbpedia.org/resource/Claude_Monet> <http://dbpedia.org/property/birthPlace> ?birthPlace .
... }"""
>>> print query(q1,"http://dbpedia.org/sparql")
{ "head": { "link": [], "vars": ["birthPlace"] },
"results": { "distinct": false, "ordered": true, "bindings": [
{ "birthPlace": { "type": "literal", "xml:lang": "en", "value": "Paris, France" }} ] } }
>>>
Я надеюсь, что это дает вам представление о том, как начать.
THx @msalvadores. Это отлично работает с DBPedia.org. Все равно нужно заставить его работать локально на машине win7. Так определенно Virtuoso (только 4store linux). Но до сих пор не удалось найти хороший учебник по установке для платформы Windows. – jaz
Даже для Virtuoso вам лучше с Linux. Если вы хотите придерживаться Virtuoso, посмотрите на этот http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VOSUsageWindows. Также имейте в виду, что если вы хотите загрузить всю DBPEDIA, вам понадобится достойная мощная машина , может быть, товарный сервер. –
не может проголосовать за вас, потому что у меня все еще недостаточно репутации. Но выбран ваш ответ как правильный! – jaz