У меня есть образец DataFrame как таковой:Получите последние данные из каждого элемента Pandas DataFrame с индексированием диапазона и столбцом даты?
df = pd.DataFrame(data=[('foo', datetime.date(2014, 10, 1)),
('foo', datetime.date(2014, 10, 2)),
('bar', datetime.date(2014, 10, 3)),
('bar', datetime.date(2014, 10, 1))],
columns=('name', 'date'))
который выглядит следующим образом:
name date
0 foo 2014-10-01
1 foo 2014-10-02
2 bar 2014-10-03
3 bar 2014-10-01
Я хочу, чтобы ограничить dataframe к только последний случай каждого элемента в столбце Имя, как Я делаю это?
я мог бы неловко (по крайней мере, я думаю, было бы неудобно) построить булевы объект Series, чтобы сделать это и передать его в DataFrame-х __getitem__
, как это:
pd[latest_name]
Как наиболее элегантно получить последняя запись для каждого элемента name
?
Хммм ... два повышений, два вниз. Интересно, почему? –