2015-11-20 23 views
1

Я хотел бы оценить производительность модуля numexpr в python (2.7). Для этой цели я создал случайную разреженную матрицу размера (10^5, 10^5). Тем не менее, скрипт ниже выдает ошибку на этапе оценки выражения уже, заявив, что он не распознает тип объекта.Numexpr не распознает тип float (разреженная матрица)

Что я делаю неправильно?

Код:

import timeit 
import scipy.sparse as sps 
import numpy as np 
import numexpr as ne 

test_matrix = sps.rand(1e4, 1e4, density=0.01, format='coo', dtype = np.float32) 
ne.evaluate('sum(test_matrix, axis = 1)') 

setup = 'import numexpr as ne; import numpy as np' 
print min(timeit.Timer('ne.evaluate(sum(test_matrix, axis = 1))', setup=setup).repeat(7, 1000)) 

Ошибка:

Traceback (самый последний вызов последнего):

File "benchmark_expressmath.py", line 19, in <module> 
ne.evaluate('sum(test_matrix, axis = 1)') 
File "C:\Users\blahblah\AppData\Local\Continuum\Anaconda\lib\site-packages\numexpr\necompiler.py", line 756, in evaluate 
signature = [(name, getType(arg)) for (name, arg) in zip(names, arguments)] 
File "C:\Users\blahblah\AppData\Local\Continuum\Anaconda\lib\site-packages\numexpr\necompiler.py", line 654, in getType 
raise ValueError("unknown type %s" % a.dtype.name) 
ValueError: unknown type object 

ответ

3

numexpr ожидает, что переменные будут Numpy массивы. Он не обрабатывает разреженные матрицы Scipy. (См., Например, эту тему по электронной почте: http://numpy-discussion.10968.n7.nabble.com/ANN-numexpr-2-3-final-released-td36154.html)

+0

Знаете ли вы какие-либо подобные пакеты для Python, которые могут обрабатывать разреженные матрицы? –

+0

Есть pysparse, но я не пробовал, и я не знаю, как его производительность сравнивается с scipy. –

+0

pysparse не имеет AFAIK с возможностями numexpr. –