дан панд HDFStore, содержащих DataFrame
:Панды HDFStore: разница между использованием выбора функции и прямой доступ
import pandas as pd
import numpy.random as rd
df = pd.DataFrame(rd.randn(int(1000)).reshape(500, 2), columns=list('ab'))
store = pd.HDFStore('store.h5')
store.append('df', df, data_columns=['a', 'b'])
я могу использовать функцию select
для извлечения подмножества данных, например, так:
store.select('df', ['a > 0', 'b > 0'])
Однако, я могу получить тот же результат, падая обратно на вид команды я мог бы использовать, если бы я использовал простой DataFrame
, который не был в HDFStore
:
store.df[(store.df.a > 0) & (store.df.b > 0)]
Есть ли разница между этими двумя подходами? Если да, в чем разница?