Я экспортировал некоторые данные из данных подкладок таблицы, установленных как csv. Когда я пытаюсь его просмотра с less
, он говорит, что may be a binary file. See it anyway?
Импорт таблицы csv в Spark
Однако, когда я делаю
cat file.csv | cut -d ',' -f 1
Он показывает считываемые данные человека (хотя он не печатает первое поле, но всей линии).
Так я пытаюсь загрузить его в Спарк 2 с:
data = sqlContext.read.csv("file.csv")
data.show(5)
И я получаю:
+--------------------+
| _c0|
+--------------------+
|��Cluster ...|
+--------------------+
Любая идея, как я могу сделать dataframe из этого предполагаемого двоичного файла?
, пожалуйста, попробуйте оценить данные вашего Tableu в CSV, используя методы по этой ссылке: http://www.vizwiz.com/2014/03/the-greatest-tableau-tip-ever-exporting.html - вы получаете читать-csv сейчас? – Yaron