mapreduce

    0зной

    1ответ

    Я пытаюсь выяснить разницу между двумя таблицами (Source и Destination) с помощью Diff() метод в свинью, для того, чтобы добиться того, что: sourcenew = LOAD 'hdfs://HADOOPMASTER:54310/DVTTest/Source.

    1зной

    2ответ

    Я пытаюсь как select * from A where A.ID NOT IN (select id from B) (in sql) filtersource= FILTER source BY ID NOT(destination.ID) Как сделать НЕ В статье или какой-либо другой техники, чтобы остро

    1зной

    1ответ

    Я группируя мой массив, используя эту функцию: Array.prototype.groupBy = function(prop) { return this.reduce(function(groups, item) { var val = item[prop]; groups[val] = groups[va

    3зной

    1ответ

    У меня есть два файла в искровом кластере, foo.csv и bar.csv, оба с 4 столбцами и одинаковыми точными полями: time, user, url, category. Я хотел бы отфильтровать foo.csv по определенным столбцам bar.c

    0зной

    1ответ

    Я пытаюсь как select * from A where A.ID NOT IN (select id from B) (in sql) sourcenew = LOAD 'hdfs://HADOOPMASTER:54310/DVTTest/Source.txt' USING PigStorage(',') as (ID:int,Name:chararray,FirstName:

    1зной

    2ответ

    Я начинаю работать с Hadoop, но я не знаю, где и как это сделать. Я работаю над OS X, и я следую инструкциям по установке Hadoop, это сделано, и это работает, но теперь я не знаю, что делать. Есть ли

    0зной

    2ответ

    У меня есть заголовок стола в таблице, и я хочу изменить его и добавить несколько столбцов. Мне нужно, чтобы новые добавленные colummns сохраняли значение по умолчанию равным нулю. Моя таблица уже заг

    0зной

    2ответ

    Я следую за Apache Map Reduce tutorial, и я нахожусь в точке назначения каталогов ввода и вывода. Я создал оба каталога здесь: ~/projects/hadoop/WordCount/input/ ~/projects/hadoop/WordCount/output/