2016-09-18 8 views
1

У нас есть небольшой хаос и кластер Greenplum.
Текущий поток трубопровода данные:Pivotal HDB - Как нажимать данные из HAWQ Внутренняя/внешняя читаемая таблица TO Greenplum

External table >> hadoop-hawq external readbale table >>hawq internal table. 

Выход: 1.We пытаются продлить трубопровод данных с использованием Greenplum. В основном, для того, чтобы нажимать HAWQ Внутреннюю таблицу или внешние считываемые данные таблицы непосредственно в greenplum. Причина в том, что мы хотим отредактировать наш файл. Кроме того, HAWQ не поддерживает обновление и удаление. есть ли какой-либо альтернативный способ приблизиться или подтолкнуть данные. Пожалуйста, направляйте.

2.How для доступа к данным HDFS через GPDB внешней таблицы с протоколом gphdfs

Заранее спасибо!

ответ

2

Если вы хотите, чтобы передавать данные в HAWQ внутренней таблицы в базе данных Greenplum, вы можете:

1) Выгрузка данных в HAWQ внутренней таблицы в файл на HDFS, используя записываемый внешнюю таблицу. Вот пример для делать выгрузку: http://gpdb.docs.pivotal.io/4380/admin_guide/load/topics/g-unloading-data-using-a-writable-external-table.html

2) Затем загрузить данные в HDFS файл в Greenplum базы данных с использованием читаемой внешней таблицы с протоколом, как gphdfs, gpfdist и т.д. Вы можете обратиться к http://gpdb.docs.pivotal.io/4320/admin_guide/load.html для деталей.

Если вы хотите направить данные в читаемую внешнюю таблицу в HAWQ в базу данных Greenplum, вы можете напрямую использовать читаемую внешнюю таблицу в базе данных Greenplum, как в HAWQ.

Для gphdfs, вот несколько примеров, которые помогли бы: http://gpdb.docs.pivotal.io/4380/admin_guide/load/topics/g-example-1-greenplum-file-server-gpfdist.html