Я новичок в искре, и я пытаюсь сделать запрос, чтобы я мог получить самые посещаемые веб-страницы.Spark request max count
Мой запрос следующий
mostPopularWebPageDF = logDF.groupBy("webPage").agg(functions.count("webPage").alias("cntWebPage")).agg(functions.max("cntWebPage")).show()
С этой просьбой я получить только dataframe с максимальным кол, но я хочу, чтобы извлечь dataframe с этим счетом и веб-страницы, которая содержит этот счет
Что-то вроде этого:
webPage max(cntWebPage)
google.com 2
Как я могу исправить свою проблему?
Большое спасибо.
Большое спасибо за вашу помощь :) – JackR
@JackR, если это вам помогло, пожалуйста, поднимитесь + отметьте как принято :) –
Я голосую за это, потому что OP кажется невежественным о том, как идут дела. :) – eliasah