Предположим, у меня есть PairRDD, студенты (id, имя). Я хотел бы сохранить только строки, где id находится в другом RDD, activeStudents (id).Как удалить строки RDD, чей ключ не находится в другом RDD?
Решение, которое у меня есть, - это создать PairDD из activeStudents, (id, id) и присоединиться к учащимся.
Есть ли более элегантный способ сделать это?