Я использую Python для соревнований по катастрофам Titanic в Kaggle. Набор данных (df) содержит 3 атрибута, соответствующих каждому пассажиру - «Пол» (1/0), «Возраст» и «Класс» (1/2/3). Я хочу получить средний возраст, соответствующий каждой комбинации Gender-Pclass.Python 3.x - Объединить кадры данных pandas
Конечный результат должен быть dataframe, как -
Gender Class
1 1
0 2
1 3
0 1
1 2
0 3
Средний возраст будет рассчитываться позже
Я попытался создать фрейм данных следующим образом -
unique_gender = pd.DataFrame(df.Gender.unique())
unique_class = pd.DataFrame(df.Class.unique())
reqd_df = pd.merge(unique_gender, unique_class, how = 'outer')
Но выход получено -
0
0 3
1 1
2 2
3 0
Может кто-нибудь, пожалуйста, помогите мне получить желаемый результат?
вы хотите что-то вроде 'df.groupby ([ 'пола', 'класс']) [ 'возраст']. Медиану()' – JohnE