Я хочу, чтобы выполнить следующий запрос на удаленный сервер Postgres из приложения PySpark с помощью JDBC connector:Как удаленно выполнить функцию Postgres SQL в Postgres с помощью соединителя JSBC PySpark?
SELECT id, postgres_function(some_column) FROM my_database GROUP BY id
Проблема в том, что я не могу выполнить этот вид запроса на Pyspark использованием spark.sql(QUERY)
, очевидно потому, что postgres_function
не является функцией ANSI SQL supported since Spark 2.0.0.
Я использую Spark 2.0.1 и Postgres 9.4.