2016-11-11 2 views
-1

У меня есть группа строк, фильтрованных по моему критерию. теперь мне нужны вычитаемые значения двух столбцов, и мне нужно их отсортировать. это те команды, которые я использовал до сих пор.вычитание значений в двух столбцах и получение нового столбца с помощью свиньи

data = LOAD '/user/imohit01017881/jk/a2dbe50d-c6e5-42e2-8fd0-5386720ce07b_Data.csv' using PigStorage(',') AS (Country:chararray, CountryCode:chararray, Series:chararray, SeriesCode:chararray, yr2000: float, yr2001:float, yr2002 :float, yr2003 :float, yr2004 :float, yr2005:float, yr2006:float, yr2007:float, yr2008 :float, yr2009 :float, yr2010:float, yr2011: float, yr2012 :float, yr2013 : float, yr2014 : float, yr2015:float); 

фильтровать строки, содержащие REQ данные:

ggdif = FILTER data by Series == 'Improved sanitation facilities (% of population with access)' 
dump data 

Ниже линии дает мне сообщение об ошибке:

sub_data = FOREACH ggdif GENERATE SUBTRACT(yr2015, yr2000); 

ответ

0

Source: SUBTRACT занимает две сумки в качестве аргументов и возвращает новый пакет, состоящий кортежей первого мешка не во втором пакете. Если нет, аргументы в сумке заменяются пустыми мешками

sub_data = FOREACH ggdif GENERATE (yr2015 - yr2000); 

 Смежные вопросы

  • Нет связанных вопросов^_^