я приходить потоковых данные следующегоСпарка сократить
id, date, value
i1, 12-01-2016, 10
i2, 12-02-2016, 20
i1, 12-01-2016, 30
i2, 12-05-2016, 40
Хочет сократить идентификатор, чтобы получить совокупную информацию стоимости по дате, как
продукция требуется от РДА для данного идентификатора и списка (дней 365) я должен поместить значение в позиции списка на основе день года, как 12-01-2016 составляет 336 и так как есть два экземпляра для устройства i1 с той же даты, когда они должны быть объединены
id, List [0|1|2|3|... |336| 337| |340| |365]
i1, |10+30| - this goes to 336 position
i2, 20 40 -- this goes to 337 and 340 position
Для этого уменьшите или измените группу.
Is Is Spark Streaming или Structured Streaming? что ты уже испробовал? Где проблема? –
Проблема - это обновление списка «на лету» и как уменьшить Do Если я уменьшу по id, все значения будут агрегированы независимо от дня года –
Какой код у вас уже есть? Это Spark Streaming? –