2016-11-24 15 views
1

Я хочу сбросить всю сущность-имя-пару с отношением.Связности сущностей из дампа freebase

Пример:

subject predicate object 
<freebase/ns/g.11bc7__xnw> <freebase/ns/people.place_lived.location> <freebase/ns/m.02_286> . 

Freebase в строке выше относится к URL из свободного основания сайта. Я извлек все триплеты, которые имеют середину объекта и объекта, тогда я использовал предикат как отношение.

Для приведенного выше примера мой код будет выводить что-то вроде этого:

entity pair : g.11bc7__xnw , m.02_286 
relation : people.place_lived.location 

У меня есть два вопроса:

  1. , когда я побежал мой код на свободного основания отвала я получил 14887 отношения, но фактическое число отношений в свободной базе - более 25 000.
  2. для некоторых средних, нет имени свойства или псевдонима. (/type/object/name, /common/topic/alias)

Скажите, пожалуйста, что я делаю неправильно.

+0

пример: <свободное основание/нс/g.11bc7__xnw> \t <свободное основание/нс/people.place_lived.location> \t <свободное основание/нс/m.02_286> \t. –

ответ

0

Ну, некоторые отношения не указывают на середине, но основное значение:

<http://rdf.freebase.com/ns/g.11vjz1ynm> <http://rdf.freebase.com/ns/measurement_unit.dated_percentage.date> "2001-02"

И это в основном вся область measurement_unit.

Затем средние, которые не имеют имени и псевдонимов, звучат как cvt (сложные типы значений), которые являются искусственными узлами, которые содержат сложную взаимосвязь (например, узел к узлу + время).

Поэтому я думаю, что вам следует лучше следить за измерениями, булевыми значениями, датами и т. Д. И cvts.

+0

Спасибо за ответ. Для моей работы я не хочу использовать эти типы составных значений. –