У меня есть отношения с пиратским набора данных со следующими полями:Расчета MIN, AVG, MAX на основе состояния
date, country_code, torrent_id, first_seen, torrent_size, quality, movie_id, value
Я хочу, чтобы сгруппировать по дате, страной, кино и качеству для расчета суммы стоимость. Но я также хочу рассчитать MIN, MAX, AVG torrent_size для всех торрентов фильма, доступных в эту дату.
Это то, что я до сих пор
A = FOREACH (GROUP data BY (date, country_code, movie_id, quality)) {
GENERATE group, SUM(data.value) as total_piracy;
};
Однако я не уверен, как сделать размер MIN, MAX, AVG торрентов фильма, доступного на сегодняшний день без учета страны.