2016-02-12 4 views
0

txt с 4 столбцами, разделенными на \ t.SparkR df читается как одна колонка

Когда я прочитал это таким образом:

A<-read.df(sqlContext,"/home/daniele/Tnt3.txt", "com.databricks.spark.csv") 

SparkR прочитал все как один столбец

a\tb\tc\td 

Как я могу изменить \ т к, в sparkR?

(я знаю, что я могу изменить его вручную, как этот sed -i 's/\t/,/g' file, но немного медленно)

ответ

1

< - read.df (sqlContext «/ главная/Daniele /Tnt3.txt "," com.databricks.spark.csv ", delimiter =" \ t ")

0

Вы должны указать разделитель.

Im новый в R, но я думаю, что это что-то вроде этого

< A -read.df (sqlContext "/ главная/Daniele/Tnt3.txt", "com.databricks.spark.csv") .Options ("разделитель", "\ т")

для получения дополнительной информации, посетите страницу искрового-CSV:

https://github.com/databricks/spark-csv