У меня есть РДД, как это:Как сгруппировать и добавить в искру?
{"key1" : "fruit" , "key2" : "US" , "key3" : "1" }
{"key1" : "fruit" , "key2" : "US" , "key3" : "2" }
{"key1" : "vegetable" , "key2" : "US" , "key3" : "1" }
{"key1" : "fruit" , "key2" : "Japan" , "key3" : "3" }
{"key1" : "vegetable" , "key2" : "Japan" , "key3" : "3" }
Моя цель состоит в том, чтобы первой группе ключом1, а затем группа по key2 и, наконец, добавить KEY3.
Я ожидаю конечный результат, как,
key1 key2 key3
"fruit" , "US" , 3
"vegetable" , "US" , 1
"fruit" , "Japan" , 3
"vegetable" , "Japan" , 3
Мой код начинается, как показано ниже,
rdd_arm = rdd_arm.map(lambda x: x[1])
rdd_arm включает выше ключ: формат значения.
Я не уверен, куда идти дальше. Может кто-нибудь помочь мне?
Привет, gsamaras. Спасибо за последующие действия. –