mapreduce

0зной

1ответ

Я пытаюсь выяснить разницу между двумя таблицами (Source и Destination) с помощью Diff() метод в свинью, для того, чтобы добиться того, что: sourcenew = LOAD 'hdfs://HADOOPMASTER:54310/DVTTest/Source.

1зной

2ответ

ли PIG есть НЕ В статье

Я пытаюсь как select * from A where A.ID NOT IN (select id from B) (in sql) filtersource= FILTER source BY ID NOT(destination.ID) Как сделать НЕ В статье или какой-либо другой техники, чтобы остро

1зной

1ответ

массив Group с группеПо

Я группируя мой массив, используя эту функцию: Array.prototype.groupBy = function(prop) { return this.reduce(function(groups, item) { var val = item[prop]; groups[val] = groups[va

3зной

1ответ

pyspark: Отфильтровать один RDD на основе определенных столбцов другого RDD

У меня есть два файла в искровом кластере, foo.csv и bar.csv, оба с 4 столбцами и одинаковыми точными полями: time, user, url, category. Я хотел бы отфильтровать foo.csv по определенным столбцам bar.c

0зной

1ответ

НЕ В статье в PIG

Я пытаюсь как select * from A where A.ID NOT IN (select id from B) (in sql) sourcenew = LOAD 'hdfs://HADOOPMASTER:54310/DVTTest/Source.txt' USING PigStorage(',') as (ID:int,Name:chararray,FirstName:

1зной

2ответ

Hadoop: как начать мой первый проект

Я начинаю работать с Hadoop, но я не знаю, где и как это сделать. Я работаю над OS X, и я следую инструкциям по установке Hadoop, это сделано, и это работает, но теперь я не знаю, что делать. Есть ли

0зной

2ответ

ALTER TABLE ADD COLUMN WITH DEFAULT NULL

У меня есть заголовок стола в таблице, и я хочу изменить его и добавить несколько столбцов. Мне нужно, чтобы новые добавленные colummns сохраняли значение по умолчанию равным нулю. Моя таблица уже заг

0зной

2ответ

Hadoop не видит мой каталог ввода

Я следую за Apache Map Reduce tutorial, и я нахожусь в точке назначения каталогов ввода и вывода. Я создал оба каталога здесь: ~/projects/hadoop/WordCount/input/ ~/projects/hadoop/WordCount/output/