У меня есть некоторые данные в HDFS @/пользователь/Cloudera/Test/. Я очень хорошо вижу записи, запустив «hdfs -dfs -cat Test/».Адрес для файловой системы HDFS
Теперь тот же файл, мне нужно, чтобы его читали как RDD в scala. Я пробовал следующее в scala shell.
вал файл = sc.textFile ("HDFS: //quickstart.cloudera: 8020/пользователь/Cloudera/Test")
Тогда я написал некоторый фильтр и для цикла, чтобы прочитать слова. Но когда я использую Println наконец, он говорит, что файл не найден.
Может кто-нибудь, пожалуйста, помогите мне узнать, какой будет HDFS-url в этом случае. Примечания: Я использую Cloudera CDH5.0 VM
так это '/ user/Cloudera/Test /' текстовый файл ?? Это похоже на папку –