2013-03-27 3 views
4

Мне нужно «сжать» размер массивов python, которые представляют сигналы. Сигналы выглядят следующим образом.Сжатие сигнала

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 

После сжатия сигнал должен выглядеть в следующем коде.

signal_compressed = [ 
    [0.0,0.2,0.3,0.4,0.5,0.8,0.9,1.0,1.1], #time values 
    [1,1,2,3,4,4,2,1,1] #function values 
    ] 

Вы видите, если есть области с постоянными значениями, только первое и последнее значение этой области сохраняется.

Я написал следующий алгоритм для этого.

signal_compressed = [[],[]] 

old_value = None 
for index, value in enumerate(signal[1]): 
    if value != old_value: 
     if index > 0: 
      if signal_compressed[0][-1] != signal[0][index - 1]: 
       signal_compressed[0].append(signal[0][index - 1]) 
       signal_compressed[1].append(signal[1][index - 1]) 
     signal_compressed[0].append(signal[0][index]) 
     signal_compressed[1].append(value) 
     old_value = value 

if signal_compressed[0][-1] < signal[0][-1]: 
    signal_compressed[0].append(signal[0][-1]) 
    signal_compressed[1].append(signal[1][-1]) 

Этот алгоритм отлично работает. А для сигналов с множеством постоянных сегментов он работает довольно быстро. Но если я пытаюсь сжать сигналы без постоянных сегментов (например, синусоидального сигнала или шумового сигнала), алгоритм работает очень медленно.

Как ускорить мой алгоритм и сохранить функциональность?

ответ

1

Вот один из способов сделать это с помощью генератора:

def compress(signal): 
    prev_t, prev_val = None, None 
    for t, val in zip(*signal): 
     if val != prev_val: 
      if prev_t is not None: 
       yield prev_t, prev_val 
      yield t, val 
      prev_t, prev_val = None, val 
     else: 
      prev_t, prev_val = t, val 
    if prev_t is not None: 
     yield prev_t, prev_val 

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 
print zip(*compress(signal)) 

Я думаю, что это было бы более естественно перенести signal, хранить его, как так:

[(0.0, 1), 
(0.1, 1), 
(0.2, 1), 
(0.3, 2), 
(0.4, 3), 
(0.5, 4), 
(0.6, 4), 
(0.7, 4), 
(0.8, 4), 
(0.9, 2), 
(1.0, 1), 
(1.1, 1)] 

Таким образом, два zip(*seq) звонки будут ненужными, и вся обработка может быть выполнена «на лету».

Наконец, если это слишком медленно для большого ввода, возможно, стоит посмотреть на использование NumPy. Вот план одного такого решения:

import numpy as np 

signal = [ 
    [0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values 
    [1,1,1,2,3,4,4,4,4,2,1,1] #function values 
    ] 

def npcompress(signal): 
    sig=np.array(signal) 
    idx = np.where(sig[1][1:] != sig[1][:-1])[0] 
    idx_arr = np.sort(np.array(list(set(idx) | set(idx + 1) | set([0]) | set([len(sig[1]) - 1])))) 
    return sig.T[idx_arr] 

print npcompress(signal).T 
+0

Спасибо за ваш ответ. Я пробовал свой алгоритм и сравнивал его с моим. Для коротких сигналов ваш алгоритм работает быстрее. Но для больших входов он медленнее, чем у меня. Не могли бы вы, пожалуйста, объяснить решение с помощью «NumPy» более подробно? – wewa

+0

@wewa: Я добавил схему одного такого решения, в котором нет петель Python. – NPE

+0

Я также пробовал этот новый алгоритм с 'NumPy'. Это немного быстрее, чем мое. Но только если вы не преобразуете numpyarrays обратно в списки. Есть ли другая возможность сжать мои данные? – wewa

1

вы можете использовать itertools.groupby():

In [93]: from itertools import groupby 

In [94]: from operator import itemgetter 

In [95]: ti=[0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1] 

In [96]: fun=[1,1,1,2,3,4,4,4,4,2,1,1] 

In [97]: def func(ti,func): 
    new_time=[] 
    new_func=[] 
    for k,v in groupby(enumerate(func),itemgetter(1)): 
     lis=list(v) 
     if len(lis)>1: 
      ind1,ind2=lis[0][0],lis[-1][0] 
      new_time.extend([ti[ind1],ti[ind2]]) 
      new_func.extend([func[ind1],func[ind2]]) 
     else:  
      new_time.append(ti[lis[0][0]]) 
      new_func.append(func[lis[0][0]]) 
    return new_time,new_func 
    ....: 

In [98]: func(ti,fun) 
Out[98]: ([0.0, 0.2, 0.3, 0.4, 0.5, 0.8, 0.9, 1.0, 1.1], 
      [1, 1, 2, 3, 4, 4, 2, 1, 1]) 
+0

Благодарим вас за интересное решение. Но и этот алгоритм не быстрее моего. – wewa

+0

@wewa Используя какой метод вы использовали эти разные решения? –

+0

'st = time.clock() cs1 = func (signal) t1 = time.clock() - st' – wewa