1
Можно ли загружать несколько файлов в виде одного кадра данных? Обычно, если у меня есть один файл для загрузки, я буду называть, например:Загрузите несколько файлов в dataframe
file1 = "https://stackoverflow.com/a/b/c/folder/file1.csv"
dc = sqlContext.read.format('com.databricks.spark.csv').options(header='false', inferschema='true').load(file1)
Но я хочу, чтобы загрузить все файлы в папке /a/b/c/folder/*.csv
.
Что произойдет, если вы попробуете 'dc = sqlContext.read.format ('com.databricks.spark.csv'). header = 'false', inferschema = 'true'). load ("a/b/c/folder/*. csv") 'Это ошибка? Это работает? –
Я получаю ошибку "java.lang.ArrayIndexOutOfBoundsException: 18002" – hdy