2013-04-29 1 views
1


Мне нужно найти «основной тип» для данной темы в файле RDF.
Когда я набираю вопрос на поле поиска по адресу http://www.freebase.com, автокомпьютер дайте мне имя темы с этим «основным типом».
Например:Как найти «основной» тип для данной темы в freebase RDF?

  1. Когда я пишу "Барак Oba", я могу видеть "Барак Обама - U.S. президента". Тема «Барак Обама» имеет много типов, но как я могу найти в файле RDF , что майор является «президентом США»?
  2. Similary "Вуди Аллен" => "сценаристом"
  3. "EOS 400D" => "Цифровые фотокамеры"

Как я могу найти этот "основной тип" в представлении RDF?

Благодарим за помощь.

ответ

0

Предположительно, вы определяете «основной тип» довольно слабо, то есть вы не слишком беспокоитесь о точном контекстуальном сопоставлении и просто хотите «самый популярный» вариант?

Предполагая, что вы можете писать и запускать запросы SPARQL, лучший способ сделать это, скорее всего, будет выполнять запрос, который находит текстовое соответствие для автоматического автозавершения текста и находит наиболее используемый термин, связанный с этим, например.

SELECT ?term (COUNT(*) AS ?triples) 
{ 
    ?term ?property ?value . 
    FILTER(REGEX(?value, "Barack Oba", "i")) 
} GROUP BY ?term ORDER BY DESC(?triples) LIMIT 1 

Обратите внимание, что использование REGEX здесь может серьезно повредить производительности, в зависимости от конкретной реализации SPARQL может быть гораздо более эффективными способами, чтобы сделать этот вид текстовой поискового запроса.

+0

Hi @RobV, Благодарим вас за ответ. Но мне нужно что-то еще. Я работаю с ** полным файлом ** из http://developers.google.com/freebase/data ** в текстовом представлении **. Информация о «основном типе» мне нужна для каждой темы **. В старом формате с четверкой была строка: _/m/047b9p0/common/topic/notable_for {"types": [], "id": "/ digicams/digital_camera", "property": "/ type/объект/тип "," имя ":" Цифровая камера "} _ где/m/047b9p0 - идентификатор для« ** Canon_EOS_1000D ** », а мой« основной тип »-« ** Цифровая камера ** » I не может найти эту информацию в новом формате RDF. – Ivo

1

Известные типы еще не включены в свалку RDF. Google сказал, что они будут, но не предоставил график.

+0

Привет, Том, спасибо за ваш ответ. – Ivo