2016-10-27 3 views
0

Я использую искровой сердечник версии 2.0.1 с помощью Scala 2.11. У меня есть простой код для чтения файла csv, который имеет \ escapes.Spark CSV Escape не работает

val myDA = spark.read 
     .option("quote",null) 
    .schema(mySchema) 
    .csv(filePath) 

Согласно документации \ по умолчанию escape для чтения csv. Но это не работает. Искра читает \ часть моих данных. Для столбца Ex: City в файле csv находится северные скалы \, au. Я ожидаю, что столбец города должен быть прочитан в коде как northrocks, au. Но вместо этого искра читает ее как northrocks \ и перемещает au в следующую колонку.

Я попытался следующие, но не получилось:

  • Явное определенный .option побег ("побег", "\")
  • Changed побег в | или: в файле и в коде
  • Я попытался с помощью искрового CSV библиотеки

Любых один обращенных того же вопрос? Я что-то упускаю?

Thanks

+0

может заменить способ разделения между ними? лежат «северные скалы: au». Я бы также попробовал обернуть все это в кавычки, например '' north rocks \, au'' – raam86

+0

К сожалению, у меня нет контроля над входным файлом. – JNish

+0

Это может быть причиной: https://issues.apache.org/jira/browse/CSV-135 – JNish

ответ

 Смежные вопросы

  • Нет связанных вопросов^_^