2014-09-19 1 views
3

В последнее время я использую API IMDBpy для очистки набора данных IMDB. В этом API есть imdbpy2sql.py, который может преобразовать набор данных фильма IMDB в базу данных SQL. Но я не могу найти описание этого набора данных. Поэтому я не могу понять схему этой базы данных SQL. В этой базе данных слишком много таблиц. Есть ли способ узнать это?Описание файла базы данных SQL, сделанного IMDBpy

Я строго следую за этим сайтом, чтобы построить свою базу данных http://blog.secaserver.com/2013/08/importing-imdb-sample-data-set-mysql/.

Большое спасибо!

ответ

8

Сомневаюсь, что слишком много таблиц. Существует много свойств/отношений.

Я сгенерировал this image раз при создании pyIRDG. Вы можете посмотреть этот код и на документацию по имеющимся данным. Вот результат комментариев: http://pastebin.com/zGnZ02w4

Я также использовал MySQL Workbench для создания схемы из db.

Существует также этот German blog article с an ERM image http://meolus.de/fileadmin/images/meolus/blog/imdb-erm.png.

Не знаю, что я знаю, и, конечно же, наш db не находится ни в каком NF. :-) В любом случае, вы можете легко просмотреть схему в модуле imdb/parser/sql/dbschema.py или использовать какой-либо инструмент непосредственно в базе данных . Source.

+0

Большое спасибо за вашу тщательность !! Это именно то, что мне нужно. Вы когда-нибудь использовали IMDbPY для очистки информации о фильмах? – Zizhao

+0

Нет, я использовал только предоставленные наборы данных IMDb. – ofthelit

+0

@ofthelit Очень старая тема, но все еще вопрос: в основном таблица aka_name выглядит немного бесполезной. Что вы считаете? –