Я читал об иерархическом индексе и мультииндексе в кадре данных pandas, но, похоже, все это для упорядоченных меток. Например, мои данные выглядит следующим образом:Групповые данные на основе метки столбцов в pandas dataframe
И я хочу, чтобы иметь возможность группировать данные вместе на основе, т.е. этикетки столбца. совокупность всех столбцов с «d» в строке 3 вместе путем усреднения.
Каков наилучший способ получить данные Excel (или csv, если это абсолютно необходимо) в dataframe, чтобы я мог выполнять эти операции и как бы я мог их выполнять?
Любые советы или ссылки будут оценены
EDIT
Я попытался загрузки данных из CSV, используя следующую команду:
data = pd.read_csv('Dataset.csv', index_col=0, header=[0,1,2,3], parse_dates=True)
, который дает мне это, когда загружен:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 18 entries, 2013-05-27 10:31:00 to 2013-07-24 11:31:00
Data columns (total 40 columns):
(1, mix, d, n) 18 non-null values
(2, aq, s, n) 18 non-null values
(3, gr, s, n) 18 non-null values
(4, mix, d, n) 18 non-null values
(5, aq, d, n) 17 non-null values
Я просто не уверен, куда идти оттуда.
где вы читаете данные из? Файл Excel или CSV? если это так, посмотрите в CSV-модуль в Python. – Oz123
Я бы предпочел читать из excel, но я просмотрел преобразование в csv, а затем поставил заголовки в виде строк, с которыми я хочу сгруппировать, но я не знаю, куда идти оттуда. Я добавлю изменения и покажу вам, что я имею в виду. – pbreach
вы пытались с 'data ['3']' как 10 мин. показывает учебник? – Oz123