Мне нужно иметь возможность возвращать список значений из пар (ключ, значение) из RDD при сохранении исходного порядка.Метод PySpark - sortByKey() для возврата значений из пар k, v в исходном порядке
Я включил свое обходное решение ниже, но я хотел бы иметь возможность сделать все за один раз.
Что-то вроде:
myRDD = [(1, 2582), (3, 3222), (4, 4190), (5, 2502), (6, 2537)]
values = myRDD.<insert PySpark method(s)>
print values
>>>[2582, 3222, 4190, 2502, 2537]
Мой обходной путь:
myRDD = [(1, 2582), (3, 3222), (4, 4190), (5, 2502), (6, 2537)]
values = []
for item in myRDD.sortByKey(True).collect():
newlist.append(item[1])
print values
>>>[2582, 3222, 4190, 2502, 2537]
Спасибо!
Спасибо, оба работали! Я пошел с методом l values. – lagunazul