У меня есть кадр данных с колонкой timestamp и числовым столбцом. Я могу добавить к нему новую строку, если столбец timestamp является наименее часовым.Как добавить на фрейм данных с колонкой timestamp с меткой времени?
df = pd.DataFrame([[1,2],[3,4]], columns=['timestamp', 'number'])
df['timestamp']=pd.to_datetime(df['timestamp'])
df
# timestamp number
# 0 1970-01-01 00:00:00.000000001 2
# 1 1970-01-01 00:00:00.000000003 4
df.append(df.loc[0])
# timestamp number
# 0 1970-01-01 00:00:00.000000001 2
# 1 1970-01-01 00:00:00.000000003 4
# 0 1970-01-01 00:00:00.000000001 2
Но если я установил часовой пояс для столбца timestamp, а затем попытаюсь добавить новые строки, я получу ошибку.
df['timestamp']=df['timestamp'].apply(lambda x: x.tz_localize('utc'))
df
# timestamp number
# 0 1970-01-01 00:00:00.000000001+00:00 2
# 1 1970-01-01 00:00:00.000000003+00:00 4
df.append(df.loc[0])
# Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/core/frame.py", line 4231, in append
# verify_integrity=verify_integrity)
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/tools/merge.py", line 813, in concat
# return op.get_result()
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/tools/merge.py", line 995, in get_result
# mgrs_indexers, self.new_axes, concat_axis=self.axis, copy=self.copy)
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/core/internals.py", line 4456, in concatenate_block_managers
# for placement, join_units in concat_plan]
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/core/internals.py", line 4561, in concatenate_join_units
# concat_values = com._concat_compat(to_concat, axis=concat_axis)
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/core/common.py", line 2548, in _concat_compat
# return _concat_compat(to_concat, axis=axis)
# File "/Library/Python/2.7/site-packages/pandas-0.17.1-py2.7-macosx-10.10-intel.egg/pandas/tseries/common.py", line 256, in _concat_compat
# return DatetimeIndex(np.concatenate([ x.tz_localize(None).asi8 for x in to_concat ]), tz=list(tzs)[0])
# AttributeError: 'numpy.ndarray' object has no attribute 'tz_localize'
Любая помощь на том, как я могу добавить новые строки в dataframe имеющей часовой пояс столбец известно timespamp будет весьма признателен.
Какова ваша версия панды. Я могу запустить этот пример в порядке 0.16.1. Как в сторону, а не делать apply (pd.to_datetime), просто выполните pd.to_datetime (df). Эта строка: df [0] = df [0] .apply (pd.to_datetime) также кажется неправильной, кажется, что вы хотите df ['timestamp'] = df ['timestamp']. , – Chris
@ Chris Это. Это, возможно, моя самая большая проблема с панда-диким кодом. Я видел такие вещи, как: 'df.apply (lambda x: x.sum()) и хуже. :/ –
@ Крис, спасибо, что указал на ошибку в вопросе. Я использую версию pandas 0.17.1. – yadu