2013-05-10 1 views
1

Я хочу найти бесплатную базу Google Api. Я хочу получить общий объем данных. Например, все идентификаторы песен или фильмов. Я загрузил gds-файлы данных. Интересно, какое будет лучшее решение для разбора файла и получения необходимых мне данных. Я использую .net C#.Google Api FreeBase анализирует данные, используя C#

ответ

1

Есть несколько .NET библиотеки, которые могут считывать формат RDF из отвалов:

Отвалы данных также отформатированный в виде отдельных значений на вкладке, чтобы вы должен иметь возможность использовать любой синтаксический анализатор CSV для анализа каждой строки в виде тройки.

Убедитесь, что вы прочитали developer docs о том, как форматируются дампы данных. В принципе, каждая строка образует тройку, в которой есть субъект, предикат и объект. Чтобы получить все данные о фильмах, вы будете искать тройки, у которых есть предикат, который начинается с/film /.

+0

Я попытался использовать уже сделанный парсер, такой как CsvReader, и он поднял ошибку: «В LumenWorks.Framework.IO.dll появилось необработанное исключение типа LumenWorks.Framework.IO.Csv.MalformedCsvException». есть идеи? – Gidi

+0

Вы сказали ему разделить на вкладках, а не на запятых? Также вам может потребоваться указать, чтобы он пропускал первые пару строк, где находятся заголовки префикса. Это сообщение об ошибке может быть чем угодно. –

+0

Не могли бы вы рассказать мне, как искать tp для актеров или режиссеров? – Gidi