У меня есть 2 RDD. Предположим, что rdd1 = {'a', 'b', 'c', 'a', 'c', 'a'}, а rdd2 - вывод KMeans с назначением кластера следующим образом:> rdd2 = {0,0,1 , 1,1,0}. Я хочу, в конце концов, узнать, сколько а и b есть в кластере 0 и 1. Например, 0 имеет 2 a, что-то вроде {0, a, 2} и т. Д. Есть ли способ объединить эти 2 RDDS для выполнения такого операция?Сочетание 2 RDD в питоне Spark
Благодарим за помощь.
Так уточнить, вы бы искали {0/а/2}, {1/а/1}, {0/б/1} , {1/c/2}, правильно ли я понимаю? –
Да, это правильно. –