2017-01-23 7 views
0

Я хочу использовать шаг S3 CSV Input для загрузки нескольких файлов из ведра s3, а затем преобразовать и загрузить обратно в S3. Но я вижу, что этот шаг поддерживает только один файл одновременно, и мне нужно указать имена файлов, есть ли способ загрузить все файлы одновременно, указав только имя ведра, то есть <s3-bucket-name>/*?Как использовать pentaho kettle для загрузки нескольких файлов из корзины s3

ответ

2

S3-CSV-Input вдохновлен CSV-Input и не поддерживает обработку нескольких файлов, например, Text-File-Input, например. Сначала вам нужно будет retrieve the filenames, поэтому вы можете перебрать список имен файлов, как и с CSV-Input.

+0

Я использовал 'Execute Shell script' для получения списка всех файлов в bucket, как я могу передать вывод stdout в цикл? – DevEx

+0

Перенаправить aws stdout во временный файл, использовать, например. 'Text-File-Input', чтобы извлечь имена файлов, передать имена файлов через« Копировать-Строки-To-Result »в преобразование цикла (расширенная опция« выполнить для каждой строки ввода »). Определите параметр FILENAME и инициализируйте его на странице настроек параметров вашего преобразования. Не забудьте включить расширенную опцию «Скопировать предыдущие результаты в параметры». Получайте удовольствие от [Чайника] (http://forums.pentaho.com/forumdisplay.php?135-Pentaho-Data-Integration-Kettle). – marabu

 Смежные вопросы

  • Нет связанных вопросов^_^