2016-12-08 8 views
2

У меня есть тысячи записей, которые я использую для приложения, которое я создаю. В последнее время я заметил, что некоторые записи имеют странное эхо.Найти, если есть эхо в звуковом файле

Запись в формате .wav, и я использую python для их обработки.

Я видел много вопросов, в которых pepole пытается отменить эхо, но мне нужно только найти эти файлы.

Есть ли инструмент или код, который я могу использовать для поиска этих файлов (нет необходимости отменять эхо).

Я попытался написать код, чтобы отменить эхо, и посмотреть, помогает ли это мне понять, когда файл имеет эхо, но это не сработало. Результирующий файл был просто шумом, поэтому я предполагаю, что мой алгоритм неверен.

def nlms(u, d, M, step, eps=0.001, leak=0, initCoeffs=None, N=None, returnCoeffs=False): 
    # Initialization 
    if N is None: 
    N = len(u)-M+1 
    if initCoeffs is None: 
    initCoeffs = np.zeros(M) 
    y = np.zeros(N) # Filter output 
    e = np.zeros(N) # Error signal 
    w = initCoeffs # Initial filter coeffs 
    leakstep = (1 - step*leak) 
    if returnCoeffs: 
     W = np.zeros((N, M)) # Matrix to hold coeffs for each iteration 

    # Perform filtering 
    for n in xrange(N): 
     x = np.flipud(u[n:n+M]) # Slice to get view of M latest datapoints 
     y[n] = np.dot(x, w) 
     e[n] = d[n+M-1] - y[n] 

     normFactor = 1./(np.dot(x, x) + eps) 
     w = leakstep * w + step * normFactor * x * e[n] 
     y[n] = np.dot(x, w) 
     if returnCoeffs: 
      W[n] = w 

    if returnCoeffs: 
     w = W 

    return y, e, w 



def CancelEcho(file_path): 
    np.seterr(all='raise') 

    audio_file = wave.open(file_path, 'r') 
    audio_params = audio_file.getparams() 
    new_frames = [] 
    u = 'a' 
    while u != " ": 
     data = audio_file.readframes(1024) 
     u = np.fromstring(data, np.int16) 
     u = np.float64(u) 
     if len(u) ==0: 
     break 
     # Generate received signal d(n) using randomly chosen coefficients 
     coeffs = np.concatenate(([0.8], np.zeros(8), [-0.7], np.zeros(9), 
           [0.5], np.zeros(11), [-0.3], np.zeros(3), 
           [0.1], np.zeros(20), [-0.05])) 

     coeffs.dtype = np.int16 
     d = np.convolve(u, coeffs) 

     # Add background noise 
     v = np.random.randn(len(d)) * np.sqrt(5000) 
     d += v 

     # Apply adaptive filter 
     M = 100 # Number of filter taps in adaptive filter 
     step = 0.1 # Step size 
     y, e, w = nlms(u, d, M, step, returnCoeffs=True) 

     new_frames.extend(y) 

    audio_file.close() 
    audio_file = wave.open(out_file, 'w') 
    audio_file.setparams(audio_params) 
    audio_file.writeframes(y.astype(np.int16).tostring()) 
    audio_file.close() 
+0

Мм .. Ты код cancel echo генерирует эхо-шум в файле, а затем удаляет его. – cjds

+0

«но это не сработало» - что не сработало, код для отмены эха или толчок в понимании того, что вы надеялись получить от написания кода? –

ответ

0

Идея была бы взять часть файла, а затем двигаться, что до конца файла и найти умножающий фактор, что он будет принимать для один сигнал, чтобы включить в другую.

Код атрибуции: https://docs.python.org/2/library/audioop.html

Это может работать:

def echocancel(outputdata, inputdata): 
    pos = audioop.findmax(outputdata, 800) # one tenth second 
    out_test = outputdata[pos*2:] 
    in_test = inputdata[pos*2:] 
    ipos, factor = audioop.findfit(in_test, out_test) 
    # Optional (for better cancellation): 
    # factor = audioop.findfactor(in_test[ipos*2:ipos*2+len(out_test)], 
    #    out_test) 
    return factor 

Чем ближе коэффициент к 1,0, тем более вероятно, есть эхо

+0

Как создать выходные/входные данные? – user844541