2016-09-27 6 views
0

У меня есть проблема запрашивая CSV-файл с заголовком, как это:Как я могу сделать запрос на файл CSV, используя заголовочный файл с апачом сверлом

ID, NOMBRE, APELLIDOS, PROVINCIA 
12121212, MARIA, LIONZA, MADRID 
12312312, JAIMITO, PEREZ, ALMERÍA 
13131313, BRUNO, DIAZ, MALAGA 
23423423, HARLEY, QUINN, BARCELONA 

Я делаю это через апач v1 бур UI. 8. Когда a сделает следующий запрос
SELECT * FROM dfs. ' path_to_file /clientes.csv»он отлично работает и возвращает таблицу, как это: enter image description here

Но если я сделать запрос с указанием названия столбцов (заголовки файла CSV), то некоторые столбцы пусты для любого причина, по которой я еще не выяснил, и сводит меня с ума pe этот запрос
SELECT ID, NOMBRE FROM dfs. ' path_to_file /clientes.csv»

Вернуться этот

enter image description here

Также я редактировал ДФС плагин и добавил свойство extractHeader к истинному

... 
"csv": { 
     "type": "text", 
     "extensions": [ 
     "csv" 
     ], 
     "extractHeader": true, 
     "delimiter": "," 
    }, 
... 

Так что я делаю неправильно ? почему я могу запрашивать по ID, но не по другим полям (именам заголовков), например, NOMBRE или PROVINCIA. Есть ли у вас какие-либо идеи?

ответ

0

Похоже на ошибку.

Удалены «extractHeader из dfs плагин

... 
"csv": { 
     "type": "text", 
     "extensions": [ 
     "csv" 
     ], 
     "delimiter": "," 
    }, 
... 

и попытался с более старым подходом

select columns[0] as id ,columns[1] as NOMBRE from `a.csv`; 

Выход:..

+-----------+-----------+ 
| id  | NOMBRE | 
+-----------+-----------+ 
| ID  | NOMBRE | 
| 12121212 | MARIA | 
| 12312312 | JAIMITO | 
| 13131313 | BRUNO | 
| 23423423 | HARLEY | 
+-----------+-----------+ 

работает отлично

+0

thx для вашего ответа, но это то, чего я пытался избежать. Я просто хотел ссылаться на столбцы через заголовок – Joseratts

+0

@ Joseratts, о котором вы можете узнать об этом на drill [community] (https://drill.apache.org/ mailinglists /) ([email protected]), если это подтвердят сверлильные люди, вы можете поднять его как ошибку JIRA. –

1

Я считаю, что проблема, с которой вы сталкиваетесь, связана с пробелами в полях заголовка.

Чтобы проверить эту гипотезу, попробуйте этот запрос (обратите внимание на пробелы и обратно клещей в названиях полей):

SELECT `ID `, `NOMBRE ` FROM <your file> 

Простое исправление для удаления пробелов в заголовке.

+0

Вы были правы. это сработало! – Joseratts

 Смежные вопросы

  • Нет связанных вопросов^_^