Есть ли эквивалент функции датированного SQL в пандах Python? Ответ на этот вопрос: Add column with number of days between dates in DataFrame pandas объясняет, как рассчитать разницу в днях. Например:pandas: функция эквивалентна датфик()?
>>> (pd.to_datetime('15-10-2010') - pd.to_datetime('15-07-2010'))/pd.offsets.Day(1)
92.0
Однако, у меня есть два вопроса:
- Есть ли способ, чтобы вычислить разницу в месяцах? Я могу аппроксимировать деление результата выше на 30, на 31, но мне было интересно, есть ли какая-то встроенная функция, которая делает это автоматически.
- Каков синтаксис pd.offsets? Я пробовал делиться на pd.offsets.Month (1), и он не работает. Я посмотрел документацию здесь (что зверским, как и все документации в Python!): http://pandas.pydata.org/pandas-docs/stable/timeseries.html#dateoffset-objects но день() не существует, так что я запутался
Кроме того, я не могу преобразовать результат в целое число. Есть идеи? –
Ммм, я нашел здесь http://stackoverflow.com/questions/22132525/add-column-with-number-of-days-between-dates-in-dataframe-pandas, как конвертировать из timedelta в float: divide by np .timedelta64 (1, 'D'). Почему и где это задокументировано, есть отдельные вопросы !!! –