У меня есть csv, который генерируется в формате, который я не могу изменить. Файл имеет мультииндекс. Файл выглядит следующим образом.Multiindex только некоторые из столбцов в Pandas
Конечная цель состоит в свою очередь верхнего ряда (часы) в индекс и индекс его с колонкой «ID», так что данные выглядит следующим образом.
Я импортировал файл в панд ...
myfile = 'c:/temp/myfile.csv'
df = pd.read_csv(myfile, header=[0, 1], tupleize_cols=True)
pd.set_option('display.multi_sparse', False)
df.columns = pd.MultiIndex.from_tuples(df.columns, names=['hour', 'field'])
df
Но это дает мне три неназванных поля:
Мой последний шаг заключается в стек на час:
df.stack(level=['hour'])
Но я пропустил то, что до этого, где я могу индексировать другие столбцы, хотя над ними стоит пустая строка с несколькими индексами.
спасибо, Яким. –
Я рад, что смогу помочь. –