Я хотел бы оценить производительность модуля numexpr в python (2.7). Для этой цели я создал случайную разреженную матрицу размера (10^5, 10^5). Тем не менее, скрипт ниже выдает ошибку на этапе оценки выражения уже, заявив, что он не распознает тип объекта.Numexpr не распознает тип float (разреженная матрица)
Что я делаю неправильно?
Код:
import timeit
import scipy.sparse as sps
import numpy as np
import numexpr as ne
test_matrix = sps.rand(1e4, 1e4, density=0.01, format='coo', dtype = np.float32)
ne.evaluate('sum(test_matrix, axis = 1)')
setup = 'import numexpr as ne; import numpy as np'
print min(timeit.Timer('ne.evaluate(sum(test_matrix, axis = 1))', setup=setup).repeat(7, 1000))
Ошибка:
Traceback (самый последний вызов последнего):
File "benchmark_expressmath.py", line 19, in <module>
ne.evaluate('sum(test_matrix, axis = 1)')
File "C:\Users\blahblah\AppData\Local\Continuum\Anaconda\lib\site-packages\numexpr\necompiler.py", line 756, in evaluate
signature = [(name, getType(arg)) for (name, arg) in zip(names, arguments)]
File "C:\Users\blahblah\AppData\Local\Continuum\Anaconda\lib\site-packages\numexpr\necompiler.py", line 654, in getType
raise ValueError("unknown type %s" % a.dtype.name)
ValueError: unknown type object
Знаете ли вы какие-либо подобные пакеты для Python, которые могут обрабатывать разреженные матрицы? –
Есть pysparse, но я не пробовал, и я не знаю, как его производительность сравнивается с scipy. –
pysparse не имеет AFAIK с возможностями numexpr. –