2016-11-05 1 views
0

Что такое простой способ чтения из HDFS в Scala, а также возможность создавать модульные тесты, которые полагаются на HDFS без требования доступа к этой HDFS? Как-то издеваться над HDFS?Чтение содержимого строки из HDFS в Scala

+1

Вы, вероятно, знаете, что просьба об общей рекомендации библиотеки не относится к теме в переполнении стека. Могу ли я предложить вам провести некоторое исследование и вернуться к конкретным вопросам? – maasg

ответ

0

Я предлагаю использовать spark.

val textFile = sc.textFile("hdfs://...") 
val counts = textFile.flatMap(line => line.split(" ")) 
       .map(word => (word, 1)) 
       .reduceByKey(_ + _) 
counts.saveAsTextFile("hdfs://...")