У меня есть пакет данных Spark, содержащий метки времени и идентификаторы машины. Я хочу удалить самое низкое значение временной метки из каждой группы. Я попытался следующий код:Выберите строки, кроме тех, которые содержат значение min в Spark, используя HiveContext
sqlC <- sparkRHive.init(sc)
ts_df2<- sql(sqlC,"SELECT ts,Machine FROM sdf2 EXCEPT SELECT MIN(ts),Machine FROM sdf2 GROUP BY Machine")
Но следующая ошибка приходит:
16/04/06 06:47:52 ERROR RBackendHandler: sql on 35 failed
Error in invokeJava(isStatic = FALSE, objId$id, methodName, ...) :
org.apache.spark.sql.AnalysisException: missing EOF at 'SELECT' near 'EXCEPT'; line 1 pos 35
В чем проблема? Если HiveContext не поддерживает ключевое слово EXCEPT, что будет синонимным способом сделать то же самое в HiveContext? поддерживается
спасибо за тонной !! – ps30