2016-11-24 1 views
1

Я новичок в кодировании и в настоящий момент изо всех сил пытаюсь найти строку кода, чтобы помочь мне разобраться в этом вопросе.Рассчитайте для каждой комбинации ORIGIN, DEST и DAY_OF_WEEK медианное значение ARR_DELA

В моих данных есть список рейсов, которые произошли с их временем задержки, а также с указанием направления и направления рейса. Я хотел бы получить совет о том, какой код я должен использовать, чтобы найти медианное значение ARR_DELAY для каждой комбинации источника, места назначения и дня недели.

enter image description here

Спасибо большое, любая помощь приветствуется.

ответ

0

использование groupby

flights.groupby(['ORIGIN', 'DEST', 'DAY_OF_WEEK']).median() 

вы также можете заполнить ваши с 0s пренебрежимо малых первых, если NaNs означает отсутствие задержки:

flights = flights.fillna(0) 
flights.groupby(['ORIGIN', 'DEST', 'DAY_OF_WEEK']).median()