Я использую RevoR entreprise для обработки импотенции больших файлов данных. Пример, приведенный в документации говорится, что 10 файлов (1000000 строк каждая) будут импортированы в качестве набора данных, используя цикл rxImport так:Как я могу получить все данные из разделенных больших файлов в R Revolution Enterprise?
setwd("C:/Users/Fsociety/Bigdatasamples")
Data.Directory <- "C:/Users/Fsociety/Bigdatasamples"
Data.File <- file.path(Data.Directory,"mortDefault")
mortXdfFileName <- "mortDefault.xdf"
append <- "none"
for(i in 2000:2009){
importFile <- paste(Data.File,i,".csv",sep="")
mortxdf <- rxImport(importFile, mortXdfFileName, append = append, overwrite = TRUE, maxRowsByCols = NULL)
append <- "rows"
}
mortxdfData <- RxXdfData(mortXdfFileName)
knime.out <- rxXdfToDataFrame(mortxdfData)
Проблема здесь в том, что я только получаю 500000 строк в наборе данных из-за maxRowsByCols
аргумент по умолчанию 1e+06
Я изменил его на более высокое значение, а затем на NULL
, но он по-прежнему усекает данные из файла.
Спасибо, я попробую это. Но я использую xdf-файл как сокращение до огромных данных, которые я собираюсь импортировать. и синтаксис data.frame предназначен для узлов Knime (они не могут обрабатывать только класс rxXDFData data.frame) –