Я хочу найти бесплатную базу Google Api. Я хочу получить общий объем данных. Например, все идентификаторы песен или фильмов. Я загрузил gds-файлы данных. Интересно, какое будет лучшее решение для разбора файла и получения необходимых мне данных. Я использую .net C#.Google Api FreeBase анализирует данные, используя C#
1
A
ответ
1
Есть несколько .NET библиотеки, которые могут считывать формат RDF из отвалов:
Отвалы данных также отформатированный в виде отдельных значений на вкладке, чтобы вы должен иметь возможность использовать любой синтаксический анализатор CSV для анализа каждой строки в виде тройки.
Убедитесь, что вы прочитали developer docs о том, как форматируются дампы данных. В принципе, каждая строка образует тройку, в которой есть субъект, предикат и объект. Чтобы получить все данные о фильмах, вы будете искать тройки, у которых есть предикат, который начинается с/film /.
Я попытался использовать уже сделанный парсер, такой как CsvReader, и он поднял ошибку: «В LumenWorks.Framework.IO.dll появилось необработанное исключение типа LumenWorks.Framework.IO.Csv.MalformedCsvException». есть идеи? – Gidi
Вы сказали ему разделить на вкладках, а не на запятых? Также вам может потребоваться указать, чтобы он пропускал первые пару строк, где находятся заголовки префикса. Это сообщение об ошибке может быть чем угодно. –
Не могли бы вы рассказать мне, как искать tp для актеров или режиссеров? – Gidi