2016-10-29 1 views
0

В настоящее время я работаю над проектом для приложений дифференциальной конфиденциальности, и я хочу поэкспериментировать с данными, которые находятся в репозитории обучения машин UCI.Как использовать наборы данных из репозитория машинного обучения UCI

Моя проблема заключается в том, что я использую подобные хранилища, когда дело доходит до экспорта наборов данных в механизм базы данных, такой как MySQL, PostgreSQL или даже nosql.

Итак, мой вопрос в том, как можно использовать любой набор данных из этого типа репозиториев в базе данных.

Я планирую использовать этот набор данных https://archive.ics.uci.edu/ml/datasets/Communities+and+Crime

+0

Назовите свой вопрос фактической базой данных, которую вы планируете использовать, и включите моментальный снимок данных, которые вы хотите использовать. –

+0

@TimBiegeleisen Я хочу использовать базу данных MySQL – fudu

ответ

1

Отказ от ответственности: У меня нет опыта работы с этим либо.

Поскольку это помечено , я даю для этого ответ, хотя работает аналогично.

Поскольку это выглядит как файл CSV, вы можете создать таблицу (@relation) с данными столбцами (@attribute). Вы должны посмотреть на каждый столбец, чтобы увидеть соответствующий тип, например. числовой может быть integer или некоторые numeric/decimal тип, строка может быть char или varchar типа.

create table crimepredict (
    state int, 
    county int, 
    community int, 
    communityname varchar(255), 
    fold int, 
    population decimal(3,2), 
    ... 
) 

И тогда вы можете импортировать файл с COPY командой

copy crimepredict from '/path/to/communities.data' null '?' delimiter ',' quote '' format csv; 

Я не знаю, если quote '' работы. Если это не так, вы должны подготовить файл данных перед импортом и обернуть имя сообщества двойными кавычками.

 Смежные вопросы

  • Нет связанных вопросов^_^