У меня есть CSV-файл, который выглядит следующим образом:как интерполировать данные в файле csv со скользящим/скользящим средним? (Python)
2000-10-01,0.2214
2000-10-02,0.18304
2000-10-03,0.20181
2000-10-04,0.19469
2000-10-05,
2000-10-06,
2000-10-07,0.11495
2000-10-08,0.23528
2000-10-09,0.16796
, но в некоторые дни значения отсутствуют, иногда только один день, иногда несколько недель без каких-либо значений. есть ли возможность интерполировать или заполнить пробелы скользящим или скользящим средним, возможно, за 15 дней до и после пропущенной даты? мой текущий код:
import pandas as pd
ts=pd.read_csv('sum.csv', parse_dates=[0], index_col=[0])
ts_inter=ts.fillna(pd.stats.moments.rolling_mean(ts,7))
ts_inter.to_csv('moving_average_ET.csv')
Проблема заключается в том, что нет никакого зазора заполняется в выходном файле. Это то же самое, что и исходные данные.
введите значения NA в dataframe: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html#pandas.DataFrame.fillna read dataframe из файла csv: http: // pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html#pandas.io.parsers.read_csv – lowtech
Я бы рекомендовал установить ['pandas'] (http: //pandas.pydata .org). Возможны многие виды интерполяции и вменения. – DSM
Да, я использую панды. И я знаю, что есть функция «roll_mean» и что я могу заполнить NA. Но я не знаю, как его объединить:/ –