Я пытаюсь использовать поток данных Google Cloud для чтения данных из GCS и загрузки в таблицы BigQuery, однако файлы в GCS сжаты (gzip), есть ли какой-либо класс, который можно использовать для читать данные из сжатых/gzipped файлов?google cloud dataflow чтение данных из сжатых данных
спасибо!
Отлично! Спасибо за обновление. как насчет производительности, любого воздействия на производительность при чтении из сжатых данных? – Echo
Не беспокойтесь! Наибольшее влияние на производительность заключается в том, что сжатый текстовый файл не будет автоматически разделяться и считываться несколькими рабочими параллельно. Читы из многих файлов будут распараллеливаться, но самая маленькая единица работы - это один файл. К сожалению, сейчас у меня нет данных о контрольных показателях или числах. Надеюсь это поможет! – MattL