Предположим, у меня есть Dataset
какого-либо класса case, например.Вывод раздела с помощью ключа в Spark с использованием набора данных API
case class Foo(colour: String, count: Int)
val ds: Dataset[Foo] = sqlContext.createDataset(Seq(
Foo("red", 10),
Foo("red", 22),
Foo("blue", 12)
))
Как сохранить это в файловой системе распределяли по одному из полей, скажем, foo
так что выходные каталоги будут:
/my-path/foo=red/
/my-path/foo=blue/
и содержимое будет выглядеть следующим образом
> cat /my-path/foo=red/*
10
22
> cat /my-path/foo=blue/*
12
Есть ли простой способ сделать это, используя имя поля класса case?