Привет, я хотел бы отметить строку из группы записей на основе некоторых правил. У меня есть dataframe, как показано нижеКак пометить строку в группе строк в искровом информационном кадре
id price date
a 100 2016
a 200 2016
a 100 2016
b 100 2016
b 100 2015
Мой выход dataframe должен быть
id price date
a 200 2016
b 100 2016
В данном dataframe правила основаны на двух columns.From г. группа идентификаторов (а, б), сначала одного основанный на максимальной цене, а второй на основе последней даты. Мои фактические правила более сложны и включают множество других столбцов.
Что лучше всего подходит для решения таких проблем. Нужно выбрать строку из группы строк на основе некоторых правил. Любая помощь будет оценена. Спасибо
Я не уверен, что понимаю, что вы подразумеваете под «маркировкой строки». Также что-то еще, что вы пробовали до сих пор? – eliasah
@eliasah «маркировка строки» означает пометку строки из группы строк. Здесь 2-я строка (id a) и первая строка (id b). Я не добился большого прогресса в этом, я попытался использовать collect_set, чтобы получить все значения и попытаться применить правила. Спасибо – John