Как я могу получить top-n (скажем, топ-10 или топ-3) для каждой группы в spark-sql
?Spark sql top n на группу
http://www.xaprb.com/blog/2006/12/07/how-to-select-the-firstleastmax-row-per-group-in-sql/ содержит руководство по общему SQL. Однако искра не реализует подзапросы в предложении where.
Это прекрасно работает в scala. Тем не менее, как строки SQL это происходит со странной ошибкой, как описано здесь https://gist.github.com/geoHeil/3dff11860ae042792cea6970447c4592 сбой: '' union '' ожидается, но '('found –
Решение: http://stackoverflow.com/вопросы/31786912/искровых отказ-союз ожидалось, но обнаружили, –