При работе с 2D-данными я вижу небольшое ускорение на 2D-массивах, но даже на больших 1D-массивах это преимущество исчезает.Может ли Dask обеспечить ускорение для 1D-массивов?
Э.Г., в 2D:
In [48]: x = np.random.random((3000, 2000))
In [49]: X = da.from_array(x, chunks=(500,500))
In [50]: %timeit (np.cumsum(x - x**2, axis=0))
10 loops, best of 3: 131 ms per loop
In [51]: %timeit (da.cumsum(X - X**2, axis=0)).compute()
10 loops, best of 3: 89.3 ms per loop
Но 1D:
In [52]: x = np.random.random(10e5)
In [53]: X = da.from_array(x, chunks=(2000,))
In [54]: %timeit (np.cumsum(x - x**2, axis=0))
100 loops, best of 3: 8.28 ms per loop
In [55]: %timeit (da.cumsum(X - X**2, axis=0)).compute()
1 loop, best of 3: 304 ms per loop
Может Даск обеспечить ускорение для 1D массивов и, если да, то что бы идеальный размер порции быть?