2016-04-15 6 views
0

Я использую Python для соревнований по катастрофам Titanic в Kaggle. Набор данных (df) содержит 3 атрибута, соответствующих каждому пассажиру - «Пол» (1/0), «Возраст» и «Класс» (1/2/3). Я хочу получить средний возраст, соответствующий каждой комбинации Gender-Pclass.Python 3.x - Объединить кадры данных pandas

Конечный результат должен быть dataframe, как -

Gender Class 
1  1 
0  2 
1  3 
0  1 
1  2 
0  3 

Средний возраст будет рассчитываться позже

Я попытался создать фрейм данных следующим образом -

unique_gender = pd.DataFrame(df.Gender.unique()) 
unique_class = pd.DataFrame(df.Class.unique()) 

reqd_df = pd.merge(unique_gender, unique_class, how = 'outer') 

Но выход получено -

0 
0 3 
1 1 
2 2 
3 0 

Может кто-нибудь, пожалуйста, помогите мне получить желаемый результат?

+0

вы хотите что-то вроде 'df.groupby ([ 'пола', 'класс']) [ 'возраст']. Медиану()' – JohnE

ответ