2017-01-24 8 views
0

Может ли кто-нибудь предложить онлайн-услуги для обмена большими файлами, более 100 ГБ, среди группы людей? В частности, мы работаем над проектом машинного обучения, который требует постоянного доступа к файлам, но без необходимости их загрузки. Для этого проекта мы будем манипулировать файлами с python и R, я знаю, что могу загружать и делиться кодом с Git, но есть ли служба (например, docker?), В которой вы можете хранить информацию и «играть» с ней в Интернете?Доля больших наборов данных между группой

Спасибо!

ответ

0

Общая практика - используйте Git для вашего кода и S3 для данных.

Вы также можете проверить инструмент с открытым исходным кодом DVC - http://dataversioncontrol.com - , который организует код моделирования Git с хранилищем S3 или GCP. Он был разработан для сценариев ML. Коды Python и R поддерживаются DVC.