2014-12-14 6 views
2

У меня есть Apache Drill, запрашивающий несжатые файлы JSON без проблем, но я борюсь с сжатыми JSON-архивами gz.Запросить сжатые gz-файлы с помощью Apache Drill

Мое понимание заключается в том, что Drill использует соединитель файла Hadoop, который, как я полагал, имел возможность обрабатывать файлы gz, но кажется, что возможности JSON для запросов Drill всегда блокируются для файлов .json.

Я пытался сделать что-то вроде этого:

"formats": { 
    "gz": { 
    "type": "json" 
    } 
} 

Однако получить файл не найден ошибка. Также попробовал это:

"formats": { 
    "json": { 
    "type": "json", 
    "extensions": [ 
     "gz" 
    ] 
    } 
} 

Это приводит к ошибке «неправильного отображения JSON».

ответ

1

Это был ошибкой, которая была исправлена ​​на последней основной ветви (0.8): https://issues.apache.org/jira/browse/DRILL-1871

Моего тестирование подтверждает, что все работает нормально, до сих пор видят проблемы, но получить некоторые результаты обратно.