2016-05-30 4 views
2

В питона панд dataframe «ДФ», у меня есть следующие столбцы:Python/Панды: создать сводную таблицу

user_id | song_id | song_duration | song_title | artist | listen_count 

Многие пользователи, возможно, слушали ту же песню - поэтому песня не уникальна в этом Таблица. Я хотел бы создать второй dataframe с только информацией о песне (с уникальными song_ids).

song_id | song_title | artist 

Мне удалось создать таблицу с song_id и song_title.

Как добавить, колонку «художник» в это?

Это не работает:

song_df = df.groupby('song_id').df['song_title','artist'].first() 

AttributeError: 'DataFrameGroupBy' object has no attribute 'df'

ответ

1

IIUC попробуйте опустить .df:

df.groupby('song_id')['song_title','artist'].first() 
+0

маленьких, но могущественный! спасибо, работает как шарм – jeangelj

0

Вы можете просто отбросить дубликаты из выбранных столбцов

song_df = df[['song_id','song_title','artist']].drop_duplicates() 
+0

Это тоже работает! Спасибо! – jeangelj