1
У меня есть простой вопрос, предположу, что у меня есть 2 РД:Скала пересечения с графом
RDD1: [a,b,b,c,c,c,d] RDD2:[a,b,c,d]
и я хочу, чтобы узнать, сколько а, Ь, с, d есть такие, что возвращаемые результаты должны быть что-то вроде:
RDD:[(a,b,c,d),(1,2,3,1)]
Это можно легко сделать с помощью списков, но в РДУ, я, кажется, собрать их первый в массив и сделать что-то вроде:
count(_==string)
есть ли что-то более легкое, с чем я мог бы работать?
спасибо за ваш ответ, ваш метод, что я в настоящее время, но я предполагал, что операции RDD будет более эффективное вычисление, потому что мне также нужно использовать результаты для объединения с другими данными, которые я обработал. – GameOfThrows