Я использую EMR для перемещения папки из локальной файловой системы в S3 в Spark с использованием fs.moveFromLocalFile API. Все работает отлично, за исключением 0-байтового файла, созданного EMRFS с именем папки $ _ $ folder для загружаемой папки EVERY.EMR создает 0 байт файлов при использовании HDFS's moveFromLocalFile API
Есть ли способ перемещения папок без создания этого фиктивного файла для каждой папки? (кроме ручного удаления этого файла). Кроме того, почему создается этот фиктивный файл? В настоящее время я использую протокол s3: //, рекомендованный командой EMR.
Это сложнее, чем вы думаете. Нам необходимо (a) убедиться, что вы не можете mkdir в файле и (b), что существуют пустые каталоги, когда вы выполняете ls. В ожидаемой семантике fs есть путь 'mkdir; ls path' возвращает что-то успешное. Клиенты FS удаляют файлы маркеров, когда создаются вещи под ними –