Просто знакомится на h2o.ai, я любя Algos и распределенные вычисления, но застрял на манипуляции с данными ...Фильтр H2OFrame по датам панд и времени (питон)
Как бы я быть в состоянии фильтровать H2OFrame на Timestamp('2011-01-01 00:00:00')
И numpy.datetime64('2011-01-02T00:00:00.000000000')
?
Так, например, я хотел бы сделать эквивалент этой даты панд нарезка
import pandas as pd
import h2o
h2o.init()
dft=pd.DataFrame({'date':pd.date_range('1/1/2011', periods=10), 'value': range(10)})
dft.ix[dft['date']>dft['date'].min()]
dft.ix[dft['date']>dft['date'].values[1]]
Я потерпел неудачу в этом
dfh2o=h2o.H2OFrame(dft)
dfh2o[dfh2o['date']>dft['date'].min()] # causes error
dfh2o[dfh2o['date']>dft['date'].values[1]] # causes error
dfh2o['date2']=dfh2o['date'].asdate() # this function doesn't exist
Обратите внимание, что я хотел бы отфильтровать на исходные значения даты, потому что я получаю их из других источников, и их будет сложно включить в H2OFrame. То есть я не хочу что-то вроде этого
dfh2o[dfh2o['date']>dfh2o['date'].min()]
dfh2o[dfh2o['date']>dfh2o[1,'date']]
И я не знаю, как Отметка преобразуется по H2OFrame
dft['date'].astype('int64').min()
Out[16]: 1293840000000000000
dfh2o['date'].min()
Out[17]: 1293858000000.0
при преобразовании панд dataframe к h2ofr все элементы из столбца временной метки преобразуются в миллисеты с эпохи. – Lauren