2010-06-05 3 views
3

Кто-нибудь знает какой-либо хороший ресурс, где можно загрузить примерные (реальные) данные для экспериментирования статистики и методов машинного обучения, таких как деревья принятия решений и т. Д.?Есть ли какие-либо полезные наборы данных, доступные в Интернете для интеллектуального анализа данных?

В настоящее время я изучаю методы машинного обучения, и было бы очень полезно иметь реальные данные для оценки точности различных инструментов.

Если кто-нибудь знает какой-либо хороший ресурс (возможно, как CSV, XLS-файлы или любой другой формат), я был бы очень благодарен за предложение.

ответ

0

На странице Kaggle вы можете найти несколько конкурсов и загрузить связанные с ними наборы данных.

Существует система, которая оценивает ваши решения в режиме реального времени, и вы увидите свое место в «живой таблице лидеров».

Это хороший способ изучения методов машинного обучения, потому что, выбирая конкурс «для знания», вы можете сравнить свое решение с другими участниками и обсудить сильные и слабые стороны различных подходов.

0

Попробуйте мой блог, пергаментную информацию, где у меня есть несколько аннотированных библиографическое курирования наборов данных и источники данных:

http://velluminformation.com/2014/03/05/big-data-public-databases-an-annotated-bibliography/.

У меня есть аннотированная библиография различных источников данных, которые доступны. Я также получил аннотированную библиографию для медицинских данных здесь:

http://velluminformation.com/2012/05/19/free-online-public-data-sources-an-annotated-bibliography/.

Очевидное раскрытие, это мой блог, поэтому есть и другие технические вещи.