2017-02-17 26 views

ответ

0

Да - с помощью Спарк Если у вас есть dataframe в руке вы можете использовать df.write.parquet("s3a://newfilename")

+0

Я предполагаю, что для его работы необходимо установить искровой кластер? – bashan

+0

в зависимости от ваших потребностей и размера данных, но вы можете начать с автономной установки –

0

вы можете работать с S3A длительного времени от автономной установки, если вы хотите, хотя я бы не рекомендовал использовать его в качестве прямое назначение работы из-за проблем с производительностью. Лучше вывести локально, а затем скопировать его там (hasoop distcp делает это).