Я пытаюсь написать обертку, которая может быть легко использована людьми, поступающими из фона Sql. Я еще не начал эту работу, и я хотел бы знать, какой подход я должен принять.Wrapper over Hive QL/UDFs/Impala Запросы
Вот описание проблемы. Если у кого-то есть много родных Sql, написанных на их данных rdbms, и они хотят переключиться на hadoop, тогда есть много проблем. Hive отказалась от основной проблемы построения таблиц в hdf. Теперь идет запрашивающая часть - для этого у нас разные каркасы, но ни одна из них не является самоцелью - как будто она может быть медленной, а другая может отсутствовать в функциях. Например, есть Impala, есть Hive QL, но тогда для конечного пользователя нет единой структуры. Я собираюсь сделать что-то вроде этого - выберите (строка с именами столбцов, tableName) .where (filter-expression) ....
Что-то вроде Linq для hdfs и под ним выяснят, что лучше способ исполнения select (hive ql или Impala), лучший способ сделать предложение where и т. д.
Предложения? Идеи? Критически?
Благодаря