от ОЙ FAQ Амазонки:Как использовать внешние данные с эластичным MapReduce
Q: Могу ли я загрузить свои данные из Интернета или где-нибудь кроме Amazon S3?
Да. Ваше приложение Hadoop может загружать данные из любого места в Интернете или из других служб AWS. Обратите внимание: если вы загружаете данные из Интернета, взимается плата за пропускную способность EC2. Amazon Elastic MapReduce также обеспечивает доступ к данным в DynamoDB на основе Hive.
Каковы спецификации для загрузки данных из внешних (не-S3) источников? Кажется, что существует нехватка ресурсов вокруг этого варианта и, похоже, не документирована в какой-либо форме.
Не уверен, что я понимаю вопрос, вы говорите: «Как загружать данные из Интернета в экземпляр Hadoop на основе EMR?» –
@ ChrisWhite да, это именно то, что я прошу. EMR позволяет получать данные из мест, отличных от S3, но не объясняет, как это сделать. –