2015-09-17 2 views
6

В настоящее время я использую Amazon Redshift для хранения агрегированных данных из 50 - 100 ГБ (т. Е. Миллионов строк) файлов с разделителями табуляции, которые каждый день помещаются в ведро Amazon S3.Есть ли способ массовой вставки в Amazon Aurora RDS непосредственно из файлов с разделителями таможни Amazon S3 на C#?

Redshift делает это легко, предоставляя команду copy, которая может быть направлена ​​непосредственно на ведро S3 для массовой загрузки данных.

Я хотел бы использовать Amazon Aurora RDS для этой же цели. Документация об Авроре сейчас тонкая, в лучшем случае. Есть ли способ массовой загрузки непосредственно от S3 в Aurora?

Насколько я могу судить,требует пути к файлу на диске, который, я полагаю, могу обойтись, загрузив tsv в экземпляр AWS и выполнив команду оттуда, хотя это не идеально ,

Я также попытался прочитать ЦС в память и построить несколько операторов insert. Это явно медленный и неуклюжий.

Идеи?

ОБНОВЛЕНИЕ 11/2016:

Как Аврора версии 1.8 теперь вы можете использовать следующие команды для навалочных данных нагрузки S3:

LOAD DATA FROM S3

или

LOAD XML FROM S3

Aurora Load From S3

ответ