2016-11-10 5 views

ответ

0

Вы можете сделать это, создавая новый RDD только второй колонке, rdd2=rdd.map(lambda l: l[1]). Затем сделайте cartesian этих два РДА:

rdd.cartesian(rdd2).map(lambda v: (v[0][0],v[0][1],v[1]))

map есть, потому что cartesian будет возвращать строки как ((id1,A),A) и map преобразует что (id1,A,A)