2015-06-24 2 views
1

Я использовал инструмент AIDA (вид с именем инструмента объекта) аннотировать корпус и получить формат, как это:Как создать карту между Freebase и Wikipedia?

2 Germany http://en.wikipedia.org/wiki/Germany 11867 /m/0345h 
6 United_Kingdom http://en.wikipedia.org/wiki/United_Kingdom 31717 /m/07ssc 

столбец 3 является соответствующий Википедия URL сущности и столбец 4 является соответствующий идентификатор Википедии. Есть ли способ сопоставить url или id с Freebase MID, как последний столбец? Последний столбец - работа другого человека. Я понятия не имею, как он это сделал и не может найти способ в другом месте.

Вот ссылка AIDA: https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/aida/downloads/

+0

[Freebase.com официально закрыт 2 мая 2016 года] (https://groups.google.com/forum/#!topic/freebase-discuss/ WEnyO8f7xOQ). –

ответ

1

Легко сопоставить оба этих EN Wikipedia IDs в тему Freebase, и это различные идентификаторы, в том числе MID, с использованием либо Freebase API, либо дампов данных Freebase. Какой из них лучше всего использовать, будет зависеть от объема данных, которые необходимо сопоставить.

Все идентификаторы Википедии хранятся в пространстве имен, заложенном в /authority/wikipedia в Freebase. Численные идентификаторы (то есть номера статей) хранятся в /authority/wikipedia/en_id для английской Википедии, поэтому вы можете использовать http://freebase.com/authority/wikipedia/en_id/11867 как один из псевдонимов для темы Германии.

Все остальные суб-пространств имен перечислены здесь: https://www.freebase.com/authority/wikipedia?ns= но другие два, которые имеют отношение к английской Википедии en и en_title, оба из которых содержат ключи, используя имена статей Википедии альфа. Последний является каноническим идентификатором и является уникальным, а первый содержит этот идентификатор, плюс идентификаторы для всех страниц перенаправления, которые указывают на него.

Оба этих URL-адресов также псевдонимы для Германии:

https://www.freebase.com/authority/wikipedia/en/Germany https://www.freebase.com/authority/wikipedia/en_title/Germany

Чтобы использовать API запросов MQLRead, построить запрос, как это:

[{ 
    "id": "/authority/wikipedia/en_id/11867", 
    "mid": null, 
    "name": null 
}] 

и анализировать полученный JSON

{ 
    "result": [{ 
    "id": "/authority/wikipedia/en_id/11867", 
    "mid": "/m/0345h", 
    "name": "Germany" 
    }] 
} 

, чтобы получить MID. Полный URL запроса будет выглядеть следующим образом:

https://www.googleapis.com/freebase/v1/mqlread/?lang=%2Flang%2Fen&query=%5B%7B+%22id%22%3A+%22%2Fauthority%2Fwikipedia%2Fen_id%2F11867%22%2C+%22mid%22%3A+null%2C+%22name%22%3A+null+%7D%5D

Вы могли бы сделать то же самое с альфа-ключами в других пространствах имен, но ключи должны быть экранированы для специальных символов, и это не стоит хлопот опишите это, поскольку у вас есть числовые идентификаторы. MQL Key Escaping описывается здесь, если кому-то еще это нужно: http://wiki.freebase.com/wiki/MQL_key_escaping

+0

Привет. Могу я спросить вас о другом вопросе? Поскольку мне нужно запрашивать данные 26G, и есть ограничение для запроса freebase, а также freebase закрывается, я думаю о загрузке всех данных на freebase и в автономном режиме. Вы знаете, как его загрузить? Спасибо!! – deathlee

+0

Несомненно, загрузка базы данных проста и инструкции являются первым хитом для каждого поискового запроса, о котором я могу думать. Что вы искали, что не удалось найти дамп данных Freebase? –

+0

Привет. Я нашел эту страницу. Но в то время я ничего не знаю о RDF. Теперь я изучаю материалы о RDF и как запрашивать данные дампа. Благодаря! – deathlee

0

Вы можете запросить Freebase с информацией в Википедии, см Freebase API docs. Запрос в свойстве/common/topic/topic_equivalent_webpage. Тем не менее, Freebase будет закрываться сейчас в ближайшем будущем, поэтому я не рекомендую прилагать к этому много усилий.

 Смежные вопросы

  • Нет связанных вопросов^_^