2017-01-16 6 views
1

Просто знакомится на h2o.ai, я любя Algos и распределенные вычисления, но застрял на манипуляции с данными ...Фильтр H2OFrame по датам панд и времени (питон)

Как бы я быть в состоянии фильтровать H2OFrame на Timestamp('2011-01-01 00:00:00') И numpy.datetime64('2011-01-02T00:00:00.000000000')?

Так, например, я хотел бы сделать эквивалент этой даты панд нарезка

import pandas as pd 
import h2o 
h2o.init() 

dft=pd.DataFrame({'date':pd.date_range('1/1/2011', periods=10), 'value': range(10)}) 
dft.ix[dft['date']>dft['date'].min()] 
dft.ix[dft['date']>dft['date'].values[1]] 

Я потерпел неудачу в этом

dfh2o=h2o.H2OFrame(dft) 
dfh2o[dfh2o['date']>dft['date'].min()] # causes error 
dfh2o[dfh2o['date']>dft['date'].values[1]] # causes error 
dfh2o['date2']=dfh2o['date'].asdate() # this function doesn't exist 

Обратите внимание, что я хотел бы отфильтровать на исходные значения даты, потому что я получаю их из других источников, и их будет сложно включить в H2OFrame. То есть я не хочу что-то вроде этого

dfh2o[dfh2o['date']>dfh2o['date'].min()] 
dfh2o[dfh2o['date']>dfh2o[1,'date']] 

И я не знаю, как Отметка преобразуется по H2OFrame

dft['date'].astype('int64').min() 
Out[16]: 1293840000000000000 

dfh2o['date'].min() 
Out[17]: 1293858000000.0 
+0

при преобразовании панд dataframe к h2ofr все элементы из столбца временной метки преобразуются в миллисеты с эпохи. – Lauren

ответ