Подключение к консоли Drill, создать новый плагин для хранения (назовем его, скажем, gcs
), и используйте следующую конфигурацию (обратите внимание, я скопировал большую часть его из s3 config, внесены незначительные изменения):
{
"type": "file",
"enabled": true,
"connection": "gs://myBucketName",
"config": null,
"workspaces": {
"root": {
"location": "/",
"writable": false,
"defaultInputFormat": null
},
"tmp": {
"location": "/tmp",
"writable": true,
"defaultInputFormat": null
}
},
"formats": {
"psv": {
"type": "text",
"extensions": [
"tbl"
],
"delimiter": "|"
},
"csv": {
"type": "text",
"extensions": [
"csv"
],
"delimiter": ","
},
"tsv": {
"type": "text",
"extensions": [
"tsv"
],
"delimiter": "\t"
},
"parquet": {
"type": "parquet"
},
"json": {
"type": "json",
"extensions": [
"json"
]
},
"avro": {
"type": "avro"
},
"sequencefile": {
"type": "sequencefile",
"extensions": [
"seq"
]
},
"csvh": {
"type": "text",
"extensions": [
"csvh"
],
"extractHeader": true,
"delimiter": ","
}
}
}
Вы нашли, как это сделать? Я пробовал список рассылки и твиттер, но не ответил:/ – Johan
Вы нашли решение для этого? Я пытаюсь запустить кластер сверла на экземплярах вычислений, которые мне нужно подключиться к облачному хранилищу Google? – sanjay