2013-03-24 3 views
0

Я пытаюсь написать обертку, которая может быть легко использована людьми, поступающими из фона Sql. Я еще не начал эту работу, и я хотел бы знать, какой подход я должен принять.Wrapper over Hive QL/UDFs/Impala Запросы

Вот описание проблемы. Если у кого-то есть много родных Sql, написанных на их данных rdbms, и они хотят переключиться на hadoop, тогда есть много проблем. Hive отказалась от основной проблемы построения таблиц в hdf. Теперь идет запрашивающая часть - для этого у нас разные каркасы, но ни одна из них не является самоцелью - как будто она может быть медленной, а другая может отсутствовать в функциях. Например, есть Impala, есть Hive QL, но тогда для конечного пользователя нет единой структуры. Я собираюсь сделать что-то вроде этого - выберите (строка с именами столбцов, tableName) .where (filter-expression) ....

Что-то вроде Linq для hdfs и под ним выяснят, что лучше способ исполнения select (hive ql или Impala), лучший способ сделать предложение where и т. д.

Предложения? Идеи? Критически?

Благодаря

ответ

1

Почему бы не использовать ODBC или JDBC драйверы для Impala? Эти драйверы используются сторонними инструментами, такими как MicroStrategy или Tableau для отправки запросов в Impala.